Stron WWW ponad dwa razy więcej niż gwiazd w naszej galaktyce

Firma Google ogłosiła, że liczba unikalnych adresów URL wykrytych przez tę wyszukiwarkę przekroczyła poziom biliona (1 i 12 zer, lub 10 do potęgi 12). Co więcej, z każdym dniem Internet rozrasta się o kolejne miliardy stron.

Wiadomość tę przekazali dwaj inżynierowie oprogramowania z Google, Jesse Alpert i Nissan Hajaj, w oficjalnym blogu Google. Jak Google znalazło te wszystkie strony? "Zaczynamy od zestawu połączonych ze sobą stron początkowych i podążamy śladem każdego z umieszczonych na nich linków do nowych stron. Potem śledzimy łącza na tych nowych stronach do kolejnych stron i tak dalej, aż otrzymamy ogromną listę linków. W rzeczywistości znaleźliśmy nawet więcej niż bilion indywidualnych linków, ale nie każdy z nich prowadzi do unikalnej strony. Wiele stron posiada liczne adresy URL z dokładnie tą samą zawartością bądź też adresy będące swoimi automatycznie wygenerowanymi kopiami. Nawet po usunięciu duplikatów otrzymaliśmy bilion unikalnych adresów URL, a liczba indywidualnych stron rośnie z każdym dniem o kilka miliardów" - piszą pracownicy Google'a.

Alpert i Hajaj nie omieszkali przy tym pochwalić się jakością swoich systemów wyszukiwawczych. "Nie indeksujemy każdej z tego biliona strona - wiele z nich jest do siebie podobnych, lub zawiera treści generowane automatycznie. To nie jest zbyt użyteczne dla poszukujących. Jednak jesteśmy dumni z posiadania najbardziej kompleksowego indeksu ze wszystkich wyszukiwarek, a nasz cel zawsze polegał na indeksowaniu wszystkich danych na świecie" - czytamy we wspomnianym wpisie.

Od czasu, gdy Google prezentowało publicznie informacje o rozmiarze swojego indeksu, minęło już nieco czasu, temat ten zresztą wywoływał zwykle kontrowersje (zwłaszcza konkurencyjne firmy podawały te wyniki w wątpliwość). Gdy okazało się, że większość użytkowników otwiera nie więcej niż dwie strony z podanych wyników wyszukiwania, temat pojemności indeksu wyszukiwarki przestał być tak emocjonujący. Ciekawe, czy i tym razem informacja ta spowoduje kontrakcję innych firm z branży wyszukiwarek, np. Yahoo czy Microsoftu.

Dla wyjaśnienia tytułu niniejszego artykułu dodajmy, że liczbę gwiazd w Galaktyce Ziemi, czyli Mlecznej Drodze, szacuje się na 200 - 400 miliardów.


Zobacz również