Každú sekundu pribudne na internete 5 miliónov nových stránok a táto rýchlosť sa neustále zvyšuje. V tomto seriáli budú opísané metódy vyhľadávania informácií.
V tejto lekcii o princípoch internetového vyhľadávača pochopíme, ako vyhľadávač triedi, opisuje a vyhodnocuje výsledky.
Triedenie výsledkov
Predstavme si hotový sud, ktorý je práve pripravený na vyhľadávacom serveri. Náš prvý vyhľadávací dotaz…
V dnešnej lekcii sa budeme venovať dátovým sudom, ich štruktúre, StopSlovu a nakoniec si popíšeme crawlery.
Dátové sudy
Ide o špeciálny typ údajov, ktorý sa nachádza na viacerých serveroch súčasne vo viacerých kópiách. Zvyčajne ide o dátovo náročné…
V dnešnej lekcii sa budeme venovať indexovaniu a kanonizácii dokumentov na internete.
Indexovanie
Proces indexovania vykonáva komponent nazývaný indexátor. Ide o špeciálne navrhnutý program, ktorý zo stiahnutých údajov (údajov, ktoré stiahol Crawler…
Každú sekundu pribudne na internete 5 miliónov nových stránok a táto rýchlosť sa neustále zvyšuje. Aby sme v tomto obrovskom mori informácií urobili poriadok a niečo v ňom našli, existujú vyhľadávače. Cieľom nasledujúcej práce je priblížiť…