Crawling (Procházení webu)


Co je to Procházení webu (Crawling)

Procházení webu, často označované též jako webové vyhledávání nebo webový prohlížeč, je proces, při kterém je počítačový program (zvaný robot nebo různě crawler), který prohledává Internet pro různé informace. Cílem tohoto procesu je shromáždit informace, které pak lze zpracovat a vyhodnocovat.

Jaká Je Funkce Procházení Webu (Crawling)

Procházení webu (crawling) poskytuje mnoho užitečných funkcí.

  • Získávání informací – Roboti pomáhají vyhledávacím engineům typu Google nebo Yahoo rozšiřovat jejich databáze informací o stránkách webů. Vyhledávací weby jsou to, co umožňuje lidem prohledávat internet k určitým záznamům.
  • Aktualizace informací – Roboty aktualizují informace uložené ve vyhledávacích webech, projížděním stránky postupně. To zaručuje, že jejich výsledky je vždy nejnovější.
  • Vyhledávání zpětných odkazů – Roboty spolupracují se vyhledávacími engine při hledání zpětných odkazů. Zpětné odkazy jsou odkazy, které ukazují z jedné stránky webu na druhou.

Jak Procházení webu (Crawling) probíhá?

Procházení webu (crawling) probíhá ve 3 krocích:

  1. Vyhledávání – Robot se prokouše skrz internet, aby vyhledal určité stránky odpovídající specifickému dotazu. Procházení webu se obvykle začíná s určením stránek, které jsou plně indexovány nebo stránek, které robot vyhledá podle URL, které jsou zadané přímo.
  2. Indexování – Jakmile roboti naleznou stránky odpovídající dotazu, celé stránky se prohlíží a vyhledávány jsou různé informace, které se použijí pro vyhledávání vyhledávacích engineů, které by se mohly lišit podle typu engine.
  3. Aktualizace databáze – Jakmile informace o stránkách jsou dosaženy, jsou uloženy do databáze vyhledávacích engine. Jsou k dispozici pro prohledání kdykoli budou potřeba.

Prohlížení webu (crawling) je důležitou součástí toho, co umožňuje nám přístup k informacím na Internetu. Díky procesu prohlížení můžeme nalézt cokoli, na čem závisí naše otázky.

Wikipedia – Webové vyhledávání