Google wchodzi w głąb Internetu

Przedstawiciele operatora najpopularniejszej wyszukiwarki zapowiedzieli rozpoczęcie testów nowych mechanizmów analizy stron internetowych. Mają one ułatwić wyszukiwanie informacji zapisanych w nieindeksowanych dotychczas elementach witryn.

Google zamierza rozszerzyć funkcje swojej wyszukiwarki o możliwość analizy treści określanych mianem Deep Web (tzw. głęboka sieć, niewidzialny Internet). Chodzi tu przede wszystkim o zawartość list rozwijanych, formularzy i innych elementów witryn, zgodnych ze specyfikacją języka HTML. Obecne algorytmy Google nie uwzględniają informacji zawartych w tego rodzaju obiektach. Wiadomo, że Google od dłuższego czasu pracował nad mechanizmami umożliwiającymi rozszerzenie treści analizowanych przez wyszukiwarkę. "Analiza formularzy HTML i innych tego rodzaju elementów stron może znacznie poprawić skuteczność wyszukiwarki" - napisano w specjalnym oświadczeniu Google.

Zapewniono, że strony o ograniczonym dostępie - zawierające jakiekolwiek mechanizmy uwierzytelniania (m.in. pola logowania), zostaną pominięte. Nieindeksowane pozostaną również witryny, których nagłówek zawiera stosowne polecenie dla indekserów. Przedstawiciele koncernu podkreślają również, że nowe mechanizmy nie będą miały wpływu na działanie algorytmów wartościujących strony PageRank.


Zobacz również