Sólin Sólin Rís 05:15 • sest 21:38 í Reykjavík
Tunglið Tunglið Rís 01:18 • Sest 04:30 í Reykjavík
Flóð Flóð Árdegis: 07:36 • Síðdegis: 19:53 í Reykjavík
Fjaran Fjara Árdegis: 01:39 • Síðdegis: 13:42 í Reykjavík

Hvernig verka leitarvélar?

Eggert Thorlacius

Leitarvélar á vefnum eru samsettar úr tveimur aðskildum einingum. Annars vegar er hópur tölva, svokallaðar köngulær, sem rekja sig í sífellu í gegnum vefinn og geyma allar síður sem þær finna í risastórum gagnagrunni, og hins vegar eru vefþjónar sem fólk um allan heim getur notað til að leita í gagnagrunninum.

Þegar leitarvél er fyrst búin til er köngulónum gefinn listi af krækjum eða síðum sem þær hefja leitina í. Í hvert sinn sem könguló rekst á krækju á vefsíðu er henni bætt í listann, þannig að það þarf ekki nema að ein síða vísi á ákveðna vefsíðu til þess að henni sé bætt í grunninn. Að sama skapi eru til síður sem hafa verið til í mörg ár en finnast ekki í neinni leitarvél vegna þess að engin önnur síða vísar í þær. Þar eð köngulærnar eru á sífelldri ferð um vefinn heimsækja þær sömu síðurnar með reglulegu millibili, þannig að ef vefsíðu er breytt líður oftast ekki á löngu áður en leitarvélarnar hafa uppgötvað breytingarnar og bætt þeim í gagnagrunna sína.

Þegar leitarvél er beðin um að leita að ákveðnu orði eða orðasambandi, finnur hún oftast mikinn fjölda síðna sem koma til greina. Hún verður þá að reyna að raða niðurstöðunum þannig að þær síður sem líklegast er að komi að gagni séu settar efstar í listann. Í gegnum tíðina hafa ýmsar aðferðir verið reyndar til þess að ákvarða hvaða síður eru gagnlegar. Í upphafi var síðunum einfaldlega raðað eftir því hve oft leitarorðið kom fyrir á þeim, en sú aðferð hafði þann ókost í för með sér að mjög einfalt var fyrir óprúttna vefstjóra að troða sínum síðum fram fyrir aðrar með því að endurtaka vinsæl leitarorð mörgþúsund sinnum á hverri síðu. Nú til dags er beitt mun flóknari aðferðum til að raða niðurstöðum. Til dæmis fylgjast sumar leitarvélar með því hvaða síður í niðurstöðunum notendur smella á og velja þær fram yfir aðrar næst þegar leitað er að sama orði. Eins beita flestar leitarvélar í dag svokölluðu meðmælakerfi, þar sem litið er á að ef síða A vísar í síðu B sé hún í raun að mæla með henni. Síður sem fá mörg meðmæli eru taldar vera áreiðanlegri en síður sem færri vísa í og þeim er því raðað framar í leitarniðurstöðunum.

Annars er besta leiðin til þess að komast að því hvernig leitarvélar virka einfaldlega sú að spyrja þær sjálfar:

Frekara lesefni af Vísindavefnum:

Mynd: HB

Höfundur

tölvunarfræðingur hjá Mönnum og músum

Útgáfudagur

25.9.2002

Spyrjandi

Ritstjórn

Tilvísun

Eggert Thorlacius. „Hvernig verka leitarvélar?“ Vísindavefurinn, 25. september 2002. Sótt 26. apríl 2024. http://visindavefur.is/svar.php?id=2711.

Eggert Thorlacius. (2002, 25. september). Hvernig verka leitarvélar? Vísindavefurinn. Sótt af http://visindavefur.is/svar.php?id=2711

Eggert Thorlacius. „Hvernig verka leitarvélar?“ Vísindavefurinn. 25. sep. 2002. Vefsíða. 26. apr. 2024. <http://visindavefur.is/svar.php?id=2711>.

Chicago | APA | MLA

Spyrja

Sendu inn spurningu LeiðbeiningarTil baka

Hér getur þú sent okkur nýjar spurningar um vísindaleg efni.

Hafðu spurninguna stutta og hnitmiðaða og sendu aðeins eina í einu. Einlægar og vandaðar spurningar um mikilvæg efni eru líklegastar til að kalla fram vönduð og greið svör. Ekki er víst að tími vinnist til að svara öllum spurningum.

Persónulegar upplýsingar um spyrjendur eru eingöngu notaðar í starfsemi vefsins, til dæmis til að svör verði við hæfi spyrjenda. Spurningum er ekki sinnt ef spyrjandi villir á sér heimildir eða segir ekki nægileg deili á sér.

Spurningum sem eru ekki á verksviði vefsins er eytt.

Að öðru leyti er hægt að spyrja Vísindavefinn um allt milli himins og jarðar!

=

Senda grein til vinar

=

Hvernig verka leitarvélar?
Leitarvélar á vefnum eru samsettar úr tveimur aðskildum einingum. Annars vegar er hópur tölva, svokallaðar köngulær, sem rekja sig í sífellu í gegnum vefinn og geyma allar síður sem þær finna í risastórum gagnagrunni, og hins vegar eru vefþjónar sem fólk um allan heim getur notað til að leita í gagnagrunninum.

Þegar leitarvél er fyrst búin til er köngulónum gefinn listi af krækjum eða síðum sem þær hefja leitina í. Í hvert sinn sem könguló rekst á krækju á vefsíðu er henni bætt í listann, þannig að það þarf ekki nema að ein síða vísi á ákveðna vefsíðu til þess að henni sé bætt í grunninn. Að sama skapi eru til síður sem hafa verið til í mörg ár en finnast ekki í neinni leitarvél vegna þess að engin önnur síða vísar í þær. Þar eð köngulærnar eru á sífelldri ferð um vefinn heimsækja þær sömu síðurnar með reglulegu millibili, þannig að ef vefsíðu er breytt líður oftast ekki á löngu áður en leitarvélarnar hafa uppgötvað breytingarnar og bætt þeim í gagnagrunna sína.

Þegar leitarvél er beðin um að leita að ákveðnu orði eða orðasambandi, finnur hún oftast mikinn fjölda síðna sem koma til greina. Hún verður þá að reyna að raða niðurstöðunum þannig að þær síður sem líklegast er að komi að gagni séu settar efstar í listann. Í gegnum tíðina hafa ýmsar aðferðir verið reyndar til þess að ákvarða hvaða síður eru gagnlegar. Í upphafi var síðunum einfaldlega raðað eftir því hve oft leitarorðið kom fyrir á þeim, en sú aðferð hafði þann ókost í för með sér að mjög einfalt var fyrir óprúttna vefstjóra að troða sínum síðum fram fyrir aðrar með því að endurtaka vinsæl leitarorð mörgþúsund sinnum á hverri síðu. Nú til dags er beitt mun flóknari aðferðum til að raða niðurstöðum. Til dæmis fylgjast sumar leitarvélar með því hvaða síður í niðurstöðunum notendur smella á og velja þær fram yfir aðrar næst þegar leitað er að sama orði. Eins beita flestar leitarvélar í dag svokölluðu meðmælakerfi, þar sem litið er á að ef síða A vísar í síðu B sé hún í raun að mæla með henni. Síður sem fá mörg meðmæli eru taldar vera áreiðanlegri en síður sem færri vísa í og þeim er því raðað framar í leitarniðurstöðunum.

Annars er besta leiðin til þess að komast að því hvernig leitarvélar virka einfaldlega sú að spyrja þær sjálfar:

Frekara lesefni af Vísindavefnum:

Mynd: HB...