Wyszukiwarki - alternatywne metody znajdowania informacji w internecie

Czy zawsze znajdujesz w internecie dokładnie to, czego szukasz? A może udaje ci się zebrać przeróżne informacje, mniej lub bardziej zbliżone do tych, które są ci potrzebne? Wyszukiwarka Google jest dobra, ale powstały niesamowite alternatywy.

Osiemdziesięcioprocentowy udział w rynku daje obecnie serwisowi Google pozycję niekwestionowanego lidera wśród wyszukiwarek internetowych. Pozostałe miejsca rozdzieliły między siebie m.in. usługi Bing, Yahoo i Ask.com, jednak mają znacznie mniejsze udziały rynkowe (każdy z nich leży na poziomie poniżej 10 procent). Wszystkie wymienione wyszukiwarki działają w podobny sposób, więc podlegają takim samym ograniczeniom. Wprawdzie są już nowe narzędzia do wyszukiwania, które wykorzystują nowatorskie metody, jednak daleko im do zdobycia popularności, choć zapewniają przejrzystsze i znacznie precyzyjniejsze rezultaty wyszukiwania.

Tradycyjne wyszukiwanie z wykorzystaniem słów kluczowych i filtrów

Stosowane powszechnie wyszukiwarki internetowe są do siebie bardzo podobne. Podstawowa różnica polega na technologii wyszukiwania, którą poszczególni operatorzy portali dokupują przeważnie od właścicieli serwisów Google czy Bing. Zatem odmienne są metody odwoływania się do dostępnych zasobów danych. Korzystanie z takiej wyszukiwarki odbywa się w dwóch etapach.

Etap 1. Użytkownik wpisuje słowa kluczowe (keywords) - a więc poszukiwane pojęcia, hasła, terminy lub frazy.

Etap 2. Następnie wybiera interesujące go odnośniki widniejące na liście rezultatów zaprezentowanych przez wyszukiwarkę. Poszczególne wyniki są tu wyświetlane w postaci prostego spisu z poszczególnymi odnośnikami w malejącej kolejności.

Bardziej szczegółowe poszukiwania z zawężeniem kryteriów, a więc dające bardziej trafne wyniki, są możliwe tylko poprzez uzupełnienie zapytania o kolejne słowa kluczowe i powtórzenie etapu 1. Google i podobne serwisy nie zapewniają tematycznego zawężania obszaru poszukiwań, np. poszukiwania w obrębie określonego kręgu tematycznego. Nie oferują możliwości wyboru na podstawie pasujących wyrazów - chociażby z wykorzystaniem odpowiedniej chmury znaczników. Większość wyszukiwarek w obecnych wersjach stosuje automatyczne uzupełnianie słów i fraz w trakcie wpisywania. Pomoc ta ma na celu ułatwienie korzystania z usługi, a także eliminowanie błędów popełnianych podczas szybkiego wprowadzania danych. Proponowane wyrażenia różnią się od siebie bardzo znacznie pod względem trafności, a niektóre z nich wprawiają w zdziwienie lub wręcz śmieszą. Tak czy inaczej, wina nie leży po stronie operatorów wyszukiwarek, bo mechanizm automatycznego uzupełniania działa na podstawie popularności zapytań wszystkich użytkowników Google’a.

Oprócz tego Google i serwisy pokrewne pozwalają ograniczać wyszukiwanie do określonych typów elementów takich jak grafika, mapy, filmy, wiadomości, zakupy, dyskusje, miejsca, blogi i inne. Dostępne jest też filtrowanie wg czasu. Ponadto Google uwzględnia lokalizację, z której pochodzi zapytanie - np. przy wyszukiwaniu w kategorii zakupy.

Pasek nawigacyjny Google – za jego pomocą można filtrować wyniki poszukiwań wg typów zawartości, np. wyświetlać tylko grafikę, tylko filmy lub tylko elementy docelowe w określonym języku lub pochodzące z określonego kraju.

Pasek nawigacyjny Google – za jego pomocą można filtrować wyniki poszukiwań wg typów zawartości, np. wyświetlać tylko grafikę, tylko filmy lub tylko elementy docelowe w określonym języku lub pochodzące z określonego kraju.

Tradycyjny sposób prezentowania wyników

Lista rezultatów wyszukiwania jest przeważnie sortowana malejąco według stopnia zgodności poszukiwanego pojęcia z dokumentem znalezionym w internecie.

Wpływ na to uporządkowanie mają różne czynniki. Każdemu z nich jest przypisana określona waga (priorytet). Do wspomnianych czynników należą liczba podlinkowań do danej strony, stopień zgodności językowej, a także zbadane metadane takie jak tytuł strony internetowej, jej opis i słowa kluczowe podane przez autora.

Oprócz tego wyszukiwarki uwzględniają zaklasyfikowania i oceny internautów odwiedzających witrynę. Dokładne poziomy rangi przyporządkowane poszczególnym czynnikom pozostają w większości wypadków pilnie strzeżoną tajemnicą przedsiębiorstwa i nie są podawane do publicznej wiadomości.

Trafność a intuicja. Gdy, poszukując konkretnych informacji, otrzymasz prostą listę rezultatów, zostaniesz skonfrontowany z kilkoma problemami. Dopiero oceniając wyniki poprzez klikanie proponowanych odnośników jeden po drugim, przekonasz się, czy dany wynik okazał się strzałem w dziesiątkę czy nie. Przypuszczalnie posprawdzasz tylko rezultaty widniejące w górnej części listy, bo im dalsza pozycja w spisie, tym mniej istotna wydaje się treść kryjąca za odsyłaczem.

Na pierwszy rzut oka internauta nie jest w stanie ustalić, dlaczego dany element znalazł się na liście wyników i dlaczego poszczególne rezultaty zajmują takie a nie inne pozycje w rankingu trafności. Wprawdzie słowa kluczowe podane przez użytkownika w zapytaniu są wyróżnione pogrubieniem w krótkim opisie pochodzącym ze znalezionej strony i zawierającym rzeczywisty fragment jej treści, lecz brakuje takich elementów jak skala oceny czy wagi poszczególnych czynników. Zatem nie uda ci się dowiedzieć, dlaczego wyszukiwarka zaproponowała ci określony adres URL, a kryjąca się za nim zawartość ma spełnić twoje oczekiwania i zaspokoić twój głód wiedzy.

Przypuszczalnie pominiesz rezultaty wyszukiwania, których zwięzły opis pod odnośnikiem nie ma, twoim zdaniem, związku ze sformułowanym przez ciebie zapytaniem. W wielu wypadkach osiągnięcie żądanego celu wymaga nie tylko dobrej wyszukiwarki, lecz także trafnej intuicji.

Profilowanie. Standardowe wyszukiwarki internetowe protokołują lokalnie preferencje poszukiwań danego użytkownika. Zakładają w jego komputerze profil wyszukiwania i starają się go interpretować. Metoda ta nosi nazwę profilowania i ma na celu - między innymi - osiągnąć większą celność, prezentując ci spersonalizowane, a więc dostosowane do twoich potrzeb rezultaty wyszukiwania. Rozwiązanie to ma jednak poważną wadę. Z czasem przestaniesz otrzymywać neutralne, obiektywne rezultaty wyszukiwania. Nie pozostaje ci więc nic innego, niż usuwać wszystkie protokoły wyszukiwarek i pliki cookie w regularnych odstępach czasu.

Yahoo z filtrowaniem – ten serwis oferuje możliwość filtrowania wyników na wzór Google’a. Najbardziej popularne wyszukiwarki są do siebie bardzo podobne.

Yahoo z filtrowaniem – ten serwis oferuje możliwość filtrowania wyników na wzór Google’a. Najbardziej popularne wyszukiwarki są do siebie bardzo podobne.

Tradycyjne wyszukiwanie - szybkie, lecz mało przejrzyste

Główną przyczyną przedstawiania rezultatów w postaci listy jest - mimo opisanych powyżej mankamentów - dążenie do skrócenia czasu wyszukiwania. Działając w ten sposób, wyszukiwarka internetowa jest w stanie bardzo szybko dostarczyć ci wyniki. Stosowanie wspomnianej listy jest podyktowane nie tylko obeznaniem użytkowników z tą formą prezentacji wyników i wprawą jej używania, lecz także łatwością jej zrealizowania z technicznego punktu widzenia i szybkością, z jaką może pojawić się na ekranie. W internetowych poszukiwaniach liczy się tylko uzyskanie jak najkrótszego czasu, który upływa od wpisania zapytania do otrzymania wyników. Jakość pod względem treści i estetyka ich zaprezentowania mają znacznie mniejsze znaczenie. Choć graficzna wizualizacja rezultatów byłaby nie tylko bardziej efektowna, lecz także łatwiejsza i wygodniejsza w użytkowaniu, i tak postawiono na zwyczajną listę, bo ta wymaga mało mocy obliczeniowej i znacznie szybciej generuje się na ekranie w komputerze docelowym internauty.

Alternatywa - rezultaty wyszukiwania ukształtowane w strukturach

Mechanizmy wykorzystujące analizę skupień (data clustering, klasteryzacja) zapewniają lepszą prezentację wyników wyszukiwania, bo organizują je w struktury. Metoda ta polega na przyporządkowywaniu określonych kategorii lub tematyk dokumentom (w tym wypadku - krotkom) i rezultatom wyszukiwania. Pojęcie klaster oznacza tyle co gromada, skupisko, kiść, pęk czy po prostu grupa. Klasteryzacja ma na celu jednoznacznie - na ile to możliwe - przypisywać rezultaty wyszukiwania jednej lub kilku takim grupom, a więc wyodrębniać grupy spośród wszystkich rezultatów.

Warunkiem powodzenia jest uprzednie wyznaczenie grup, a więc kategorii, tematyk lub warstw, które z kolei są definiowane słowami kluczowymi i fachowymi pojęciami. Aby dany dokument mógł być przydzielony do grup(y), musi być sklasyfikowany poprawnie i - na ile to możliwie - całkowicie. Realizacja tego zamierzenia nie zawsze okazuje się nazbyt łatwa. Aby jej dokonać, wyszukiwarka odczytuje, po czym bada dane klasyfikujące i metadane dokumentu. Ponadto analizuje treść dokumentu na podstawie obliczeń statystycznych (bierze pod uwagę częstotliwość występowania liter, sylab i słów, kolejność fraz, a także długość słów i zdań) lub stosuje algorytmy analizy lingwistycznej. Im bardziej dokładne są te dane, tym precyzyjniej można przydzielić dokument do określonej grupy.

Carrot Search z nowatorskim sposobem wizualizowania wyników w postaci baniek mydlanych w pianie, które rozgraniczają poszczególne grupy tematyczne. Umyślna „pomyłka” w zapytaniu dowodzi, że narzędzie samodzielnie koryguje błędy.

Carrot Search z nowatorskim sposobem wizualizowania wyników w postaci baniek mydlanych w pianie, które rozgraniczają poszczególne grupy tematyczne. Umyślna „pomyłka” w zapytaniu dowodzi, że narzędzie samodzielnie koryguje błędy.


Zobacz również