Inteligentne wyszukiwarki

Nowe serwisy wyszukiwawcze potrafią nie tylko szybciej przedrzeć się przez informacyjny gąszcz, jakim powoli staje się Internet, lecz także są coraz skuteczniejsze.

Nowe serwisy wyszukiwawcze potrafią nie tylko szybciej przedrzeć się przez informacyjny gąszcz, jakim powoli staje się Internet, lecz także są coraz skuteczniejsze.

Olbrzymia liczba stron WWW (w br. działa ok. 1,7 mld witryn) oraz gwałtowny przyrost zasobów informacyjnych uniemożliwia efektywne odnajdowanie informacji za pomocą serwisów wyszukiwawczych opartych na wyszukiwaniu tekstowym. Nawet najbardziej zaawansowane narzędzia mają coraz większe trudności z wyszukiwaniem właściwych stron WWW. Najczęściej podają bowiem obszerne listy nie zawsze trafnych wyników. Obecnie w fazie testów znajdują się wyszukiwarki internetowe nowej generacji, oferujące efektywniejsze metody odnajdowania dokumentów.

Clever (Clientside Eigenvector Enhanced Retrieval)

www.almaden.ibm.com

System wyszukiwawczy utworzony przez IBM analizuje liczbę oraz typ linków prowadzących do stron WWW, aby odnaleźć wiarygodne źródła informacji. Clever rozpoczyna od 200 najtrafniejszych wyników podanych przez komercyjną wyszukiwarkę, tj. AltaVista. Lista zostaje rozszerzona o każdą witrynę prowadzącą do i z serwisów znajdujących się w oryginalnej dwusetce. Następnie system analizuje charakterystykę linków umieszczonych na tych stronach, nadając serwisom miano hubów, stron "autorytatywnych" lub usuwając je z wyników. Na przykład na zapytanie "basebal" Clever za serwis autorytatywny uzna stronę Major League Baseball, a za hub Đ baseball-links.com. Aby uporządkować kolejność pozycji na oryginalnej liście witryn oraz zaprezentować bardziej relewantne wyniki, Clever analizuje także informacje umieszczone na samej stronie WWW (tj. czy słowo użyte w zapytaniu znajduje się wewnątrz linku, czy też niedaleko niego?). Obecnie Clever wciąż znajduje się w fazie budowy i jest niedostępny dla przeciętnych użytkowników.

Hub - strona prowadząca użytkownika do odpowiednich informacji na dany temat za pośrednictwem linków odsyłających do wielu autorytarnych źródeł.

Witryna autorytarna - serwis zawierający odpowiednio duży zasób wartościowych informacji na poszukiwany temat.

Google

www.google.com

Specjalne algorytmy, w jakie wyposażony jest ten system, uznają wyniki wyszukiwania za trafne na podstawie analizy linków prowadzących do nich z innych "ważnych" serwisów, na przykład: link prowadzący do danej witryny z HotBota nada stronie wyższą kategorię niż link odsyłający ze strony prywatnej. Oczywiście znacznie większa liczba linków prowadzących z prywatnych stron WWW może

przesunąć pewną stronę w wynikach wyszukiwania o kilka pozycji. Google gromadzi wyniki poszukiwania za pomocą systemu indeksującego zawartość Sieci. Następnie opatentowany system Page Rank analizuje dane dotyczące linków, ustalając, które ze stron są najważniejsze (obliczanie "ważnośc" strony jest wypadkową ważności stron odsyłających do niej). Aby wygenerować wyniki docelowe, jeszcze bardziej złożone algorytmy wiążą wyniki analizy linków oraz informacje kontekstowe (tj. odległość, w jakiej znajdują się poszukiwane słowa na danej stronie). System znajduje się obecnie w fazie testów beta.

Direct Hit

www.directhit.com

System wyszukiwawczy efektywność swą opiera na założeniu, że ludzie chętniej powracają do serwisów, które uznają za najlepsze. Direct Hit oblicza, które strony WWW będą bardziej użyteczne dla osoby poszukującej danej informacji na podstawie ciągłego monitorowania stopnia popularności pewnych serwisów. System również analizuje, z których wyników wyszukiwania najczęściej korzystają użytkownicy, a następnie jak długo pozostają na stronach, do których owe wyniki odsyłają. Kiedy po raz kolejny otrzyma takie samo zapytanie, na liście 10 trafnych wyników znajdą się strony najczęściej wybierane przez użytkowników.


Zobacz również