Zoeken op het InternetDit is een lange tekst. Als u hem echt op uw gemak
wilt lezen, print hem dan uit. Bij on line raadplegen (zoals u nu doet), kunt u wel direct
doorklikken naar de genoemde zoekmachines.
InleidingHet Word Wide Web is een onuitputtelijke bron van nuttige informatie,
die helaas niet altijd even makkelijk te vinden is. Zoekprogrammas (search
engines)
zijn onontbeerlijk om zo snel mogelijk tot resultaat te komen. Een search engine is een online te raadplegen database (gegevensbestand: opslag van
gegevens) met trefwoorden, tekst, omschrijvingen en de bijbehorende verwijzingen naar
webpaginas. U kunt die database bedienen vanaf een webpagina door middel van het
opgeven van een of meer trefwoorden. Lijfelijk kunt u zich voorstellen dat er ergens
krachtige computers staan waarop continu een programma draait dat de database beschikbaar
houdt en telkens aanvult. Webpaginas waarop de door u aangegeven trefwoorden worden
aangetroffen, worden door het programma getoond in een overzicht. In dat overzicht staan
de links waarop u kunt klikken, zodat u gelijk naar de betreffende pagina kunt. Meestal
krijgt u bij elke link een omschrijving zodat u ongeveer weet wat er op de bewuste pagina
te vinden is. De werkingHet is onmogelijk een search engine te maken die alle
webpaginas indexeert, maar er zijn wel programmas die een groot deel van het
Web bestrijken. Bij deze engines worden ook de meeste nieuwe adressen aangemeld, waardoor
de kans op een succesvolle zoektocht daar het grootste is. Hoe komt een search engine nu aan die nieuwe adressen? In de eerste plaats worden die door
de makers van de paginas aangemeld. Daarnaast bevatten de meeste engines zogenaamde
spiders of robots. Dat zijn programmas die zelfstandig het
Net kunnen afspeuren op zoek naar nieuwe paginas en hun inhoud. De spiders houden de
zaak ook up to date. Gegevens van paginas die niet meer bestaan, worden regelmatig
verwijderd uit de database. Wanneer een pagina uit de database een link bevat, dan wordt
ook die bezocht en aan de database toegevoegd. Zo worden er dagelijks gigantische
hoeveelheden paginas afgezocht. Hoe de gegevens worden verwerkt, verschilt per
search engine, evenals de frequentie waarmee de database wordt bijgehouden. Sommige robots
gaan dagelijks aan de slag, terwijl andere het rustiger aan doen. Bij sommige search
engines is er een menselijke redactie die de paginas verwerkt. Om een search engine te laten werken, is een heleboel apparatuur nodig, wat veel kosten
met zich meebrengt. Toch is het gebruik van de zoekmachines gratis. Hoe kan dat? Het
antwoord is: reclame. Een populaire engine trekt per dag heel wat bezoekers. Web Crawler
wordt bijvoorbeeld per dag rond de vijf miljoen keer geraadpleegd! Dat is voor
adverteerder dus bijzonder aantrekkelijk, zodat zij graag voor heel veel geld willen
adverteren. Er zijn ook zoekmachines die wat anders werken. Een voorbeeld hiervan is
Yahoo: deze zoekmachine toont categorieën met subcategorieën. Zo is er bijvoorbeeld de
categorie Business and Economy, met als subcategorie Companies en als subsubcategorie
Books. In elke categorie zijn verwijzingen opgenomen naar relevante paginas. De
indeling gebeurt handmatig, zodat de indeling ook heel betrouwbaar is. Verder zijn er nog zoekmachines die zelf weer zoekacties ondernemen bij andere
zoekmachines. Deze noemen we meta search engines. Het zoekprincipeDe werking van de grootste engines ontloopt elkaar niet veel. Als u een
search engine bezoekt, is er altijd een invulveld te vinden waarin u een of meer
trefwoorden kunt invullen. Verder is er altijd een knop waarmee u de engine na het
invullen aan het werk zet. De meeste engines zitten slim in elkaar en proberen een opdracht zo goed mogelijk te
analyseren. Het eerste wat u kunt proberen, is een of meer trefwoorden op te geven, of een
omschrijving van wat u zoekt. Wanneer u bijvoorbeeld op zoek bent naar informatie over
bruine teddyberen, dan kunt u een poging wagen in de vorm van de woorden bruine
teddyberen. Als u Nederlandse woorden invult, is dat geen probleem omdat de meeste
Nederlandse paginas ook worden aangemeld bij de grote Engelstalige zoekmachines. Aan
de andere kant moet u wel beseffen dat u dan ook alleen Nederlandse paginas zult
vinden (of het Nederlandse woord moet per ongeluk ook in een andere taal voorkomen, met
godweetwelke betekenis). Wanneer het woord dat u invult, erg algemeen is, zal het aantal paginas dat gevonden
wordt, enorm groot zijn. Wilt u effectief zoeken, dan moet u een meer gedetailleerde
zoekopdracht geven, dus uw zoekopdracht verfijnen. Het kiezen van de juiste woorden is een
kunst. Zoekt u naar appels of mag het fruit zijn? Of alleen Granny Smith? Zoekt u iets
over Karel Appel of over een appel? Logische operatorenU kunt een zoekopdracht verfijnen met behulp van zogenaamde logische
operatoren (de zogenaamde boolean search). U kunt dan bijvoorbeeld aangeven dat
wilt zoeken op het woord Internet, maar dat u niet geïnteresseerd bent in
paginas die over E-mail gaan. Verder kunt u aangeven dat een pagina verschillende
woorden moet bevatten. Als u handig om kunt gaan met dit soort technieken, zult u veel
beter zoekresultaat hebben. De logische operatoren zijn: AND, OR, NOT en NEAR. Zo zal een zoekopdracht waarin u eenvoudigweg de woorden jul en jut achter
elkaar zet (wat hetzelfde is als wanneer u er OR tussen zet), paginas opleveren
waarin jut voorkomt, alsmede paginas waarin jul voorkomt, alsmede
paginas waarin ze beide voorkomen. De opdracht jut AND jul (maak er een
gewoonte van de boolean phrase, de logische operator, in hoofdletters te zetten) levert
alleen paginas op waarin beide woorden voorkomen. Bij sommige engines kan men ook
een plusteken voor het woord zetten om aan te geven dat er per se in voor moet komen: jut
+ jul (of: +jut +jul). De opdracht auto NOT Fiat maakt duidelijk dat u alle paginas zoekt waarin het
woord auto voorkomt, behalve die waarin het woord Fiat voorkomt. Denk eraan dat u dan ook
een pagina waarin de zin staat: "wij houden van elke auto behalve als het een Fiat
is" niet in de lijst zult gaan aantreffen! Wilt u heel precies naar een zinsnede of een woordcombinatie zoeken, dan kunt u het hele
stuk tussen aanhalingstekens plaatsen: "Annie M.G. Schmidt" . Met de logische operator NEAR kunt u aangeven dat de ingevulde trefwoorden in de
paginas bij elkaar moeten staan. Afhankelijk van de zoekmachine wordt er dan gezocht
naar woorden die vlak naar elkaar staan. Voorbeeld: pink NEAR floyd zoekt alleen
naar die paginas waarin de woorden pink en floyd vlak naast elkaar staan. De meeste
zoekmachines gaan overigens een stap verder: u kunt aangeven hoever de woorden uit elkaar
mogen staan. U kunt bijvoorbeeld werken met de zoekopdracht pink NEAR/10 floyd:
hierbij wordt gezocht naar paginas waar beide woorden binnen een afstand van tien
woorden van elkaar voorkomen. De logische operatoren kunt u direct in het invulveld opgeven. De meeste zoekmachines
hebben echter ook de mogelijkheid om via een menu aan te geven welke logische operator u
wilt hebben. Overigens: de meeste zoekmachines maken geen onderscheid tussen hoofd- en kleine letters,
maar voor alle zekerheid kunt u beter wel gebruik maken van kleine letters. De logische operatoren kunnen ook nog gecombineerd worden, zodat
ingewikkelde zoekopdrachten ontstaan zoals: (dieren OR animals OR animaux) AND (mensen
OR people OR hommes) NOT Darwin. De zoekmachinesAantal paginas in database: 100 miljoen Updatefrequentie: 1 dag tot drie maanden Altavista neemt ook de inhoud van nieuwsgroepen op in de database. U kunt zoeken naar afbeeldingen. U doet dit door in het invulveld aan te geven: image:naam
(waarbij voor naam het onderwerp ingevuld wordt waarvan u een afbeelding zoekt.
Bijvoorbeeld: image:clinton. U kunt ook nog op vergelijkbare wijze andere dingen specificeren. De help-functie van het
programma geeft daarvoor aanwijzingen. Altavista laat een beknopte beschrijving zien van elke gevonden pagina. Verder is de
omvang van de pagina in bytes aangegeven. Ook de datum van aanmelding van de pagina wordt
weergegeven, evenals de taal ervan. |