W poszukiwaniu grafiki

Większość z nas zgodzi się bez wahania, że o atrakcyjności Internetu w dużej mierze decyduje - oprócz takich czynników, jak szybkość przekazywania informacji i możliwość aktywnego ich odbioru - wizualna postać dostępnych w sieci zasobów.

Większość z nas zgodzi się bez wahania, że o atrakcyjności Internetu w dużej mierze decyduje - oprócz takich czynników, jak szybkość przekazywania informacji i możliwość aktywnego ich odbioru - wizualna postać dostępnych w sieci zasobów.

Poza niewątpliwymi walorami estetycznymi, wiążącymi się z odbiorem treści w powiązaniu z ilustracją graficzną (zarówno w postaci statycznych obrazków, jak i całych sekwencji wideo), można wymienić też inne zalety takiej prezentacji danych. Za pomocą obrazu graficznego możemy łatwiej wyjaśnić skomplikowane i abstrakcyjne pojęcia, trudne do opisania wyłącznie za pomocą słowa pisanego. Trudno przecenić też znaczenie grafiki jako dokumentu - cóż warte byłyby bowiem internetowe strony NASA czy popularnych serwisów informacyjnych, takich jak CNN bądź Reuters, gdyby zabrakło na nich odpowiedniej ilustracji graficznej prezentowanych wydarzeń?

W Internecie nie istnieje żadne narzędzie, oferujące taką skuteczność w odnajdywaniu grafik, jaką w zasadzie poszczycić się może dowolna wyszukiwarka (HotBot, AltaVista, Yahoo) w odniesieniu do dokumentów tekstowych. Obecnie prowadzone są prace nad nowymi systemami katalogowania ilustracji graficznych oraz wyszukiwania obiektów na podstawie ich właściwości fizycznych i treści.

Wraz z upowszechnieniem grafiki w cyberświecie pojawił się problem nieodłącznie związany z gromadzeniem i przekazywaniem dużych zasobów informacji (w dowolnej formie) - jak skatalogować i sklasyfikować wciąż rosnące zbiory dostępnych z poziomu WWW ilustracji?

Problem ten staje się szczególnie widoczny, gdy zachodzi potrzeba odnalezienia w przepastnych zasobach Sieci konkretnej grafiki. Obecnie nie istnieje żadne narzędzie oferujące taką skuteczność w odnajdywaniu grafik, jaką poszczycić się może dowolna w zasadzie wyszukiwarka (HotBot, AltaVista, Yahoo) w odniesieniu do dokumentów tekstowych. Sprawę dodatkowo utrudnia fakt, iż dostępna w Internecie grafika (zarówno statyczna, jak i ruchoma) pojawia się niemal wyłącznie w postaci bitmap, które generalnie trudno poddać jakiejkolwiek analizie jakościowej. Co innego jeśli chodzi o obrazy wektorowe, w ich przypadku każdy widoczny na rysunku obiekt posiada wiele właściwości (takich jak kolor, wielkość, kształt, rodzaj animacji, itp.) pomocnych w procesie analizy badanego obrazu.

KATALOGOWANIE

Pracownicy amerykańskich placówek badawczych twierdzą, iż kluczem do uzyskania wysokiej skuteczności wyszukiwarek graficznych jest połączenie metody opartej na analizie obrazu z opcjami wyszukiwania tekstowego. Dopiero powiązanie tych dwóch technologii - analizy obrazu (w celu zbadania jego cech fizycznych) i analizy tekstowej (w celu wychwycenia kontekstu, sytuacji) - pozwoli na stworzenie skutecznej i elastycznej w działaniu wyszukiwarki obiektów graficznych.

Większość istniejących (lub będących w fazie projektowania) systemów katalogowania i wyszukiwania obrazu rozpoczyna analizę od zamiany grafiki bitmapowej (popularnych formatów JPEG czy GIF i AVI, QuickTime czy też MPEG) na zbiór obiektów wektorowych. W efekcie takiej konwersji powstaje zbiór obiektów podstawowych (ang. primitives), najczęściej są to prostokąty - program analizujący zapamiętuje ich wymiary, wzajemne położenie i kolory. Następnie analizowane są zachodzące między nimi relacje, zaś uzyskany w ten sposób ciąg zależności porównywany z zapisami wzorcowymi (swego rodzaju matrycami charakterystycznymi dla różnych obiektów: ludzi, zwierząt, pojazdów, części garderoby itp.), zgromadzonymi w bazie danych systemu. Taka metoda jest niezależna od wielu czynników utrudniających analizę: orientacji obiektu na obrazku czy wzorzystego i skomplikowanego tła. Proces rozpoznawania zawartości obrazu wygląda podobnie w przypadku analizy ruchomych sekwencji wideo. Tutaj jednak dodatkowym czynnikiem opisującym obiekty jest ich ruch (kierunek, prędkość). Jego tor jest zazwyczaj opisywany matematycznie za pomocą tzw. krzywych Beziera.

Opisane procesy towarzyszą pierwszemu etapowi pracy systemu wyszukiwawczego - jego rolą jest skatalogowanie opublikowanych w sieci WWW grafik. Etap ten przypomina katalogowanie dokumentów tekstowych: robot wyszukiwarki indeksuje osadzone na stronach pliki graficzne, system analizujący zaś klasyfikuje je wg podanych kryteriów. W wyniku procesu katalogowania w bazie danych systemu zapisywany jest adres URL pliku wraz z wieloma przypisanymi mu na podstawie analizy cechami. Zestaw ten obejmuje właściwości: kolor, wielkość, orientację przestrzenną obiektu lub obiektów, kształt, względnie rodzaj animacji. Niektóre systemy katalogujące kopiują indeksowane grafiki na własny serwer, aby przyspieszyć proces pobierania pliku przez użytkownika.

SYSTEM WYSZUKIWAWCZY

Drugim, nie mniej ważnym modułem, jest motor wyszukujący (ang. engine), odpowiedzialny za "obsługę użytkownika", budowę zapytań i wybór obrazów dostosowanych do przyjętych kryteriów.

Poszukiwanie obrazów może odbywać się na dwóch poziomach: niższym, bazującym na właściwościach fizycznych obiektu, oraz wyższym, zorientowanym na semantykę (tzn. zawartość treściową) grafiki. Pierwszy sposób jest stosunkowo prosty w realizacji - system porównuje podane przez użytkownika kryteria z danymi zgromadzonymi w bazie skatalogowanych plików. Niestety, wraz z prostotą rozwiązania idzie w parze mała skuteczność i niewielka wygoda dla użytkownika. Aby posłużyć się takim systemem wyszukiwania obrazków, użytkownik musi podać cechy interesującego go obrazka (np. "pokaźny żółto-brązowy obiekt usytuowany na zielono-niebieskim tle"), nie może zaś po prostu opisać, co chciałby na nim zobaczyć ("jeleń stojący na łące" - patrz poprzedni opis). Charakterystyczną cechą tego systemu jest zorientowanie na obiekty. Toteż korzystając z niego powinniśmy mieć ogólne pojęcie na temat wyglądu poszukiwanej grafiki - bez względu na to, co ona przedstawia. Istniejące rozwiązania zapewniają różne metody wprowadzania zestawu poszukiwanych właściwości grafiki - najczęściej w polu dialogowym wpisujemy interesujące nas cechy (kształt, kolor obiektu i tła, wielkość). Odmiennym podejściem jest wyszukiwanie oparte na schemacie czy też ogólny zarys obrazu graficznego - w takim przypadku wybieramy go z kilkudziesięciu dostępnych ilustracji bądź samodzielnie rysujemy szkic. Niektóre systemy (np. WebSEEk) udostępniają także opcje, umożliwiające ustalenie zawartości poszczególnych kolorów w interesującym nas zdjęciu.

Z punktu widzenia użytkownika - bardziej atrakcyjnym rozwiązaniem jest druga, semantyczna metoda odnajdywania obrazów. Niestety, istniejące projekty tego typu są wciąż mało skuteczne. Najwięcej problemów sprawia interpretacja wprowadzonego opisu obiektu, zamieniająca go na ciąg prostych cech fizycznych. Specjaliści w tej dziedzinie (pracownicy amerykańskich placówek badawczych) twierdzą, iż kluczem do uzyskania wysokiej skuteczności wyszukiwarek graficznych jest połączenie metody opartej na analizie obrazu z opcjami wyszukiwania tekstowego. Połączenie tych dwóch metod: analizy obrazu (w celu zbadania jego cech fizycznych) i analizy tekstowej (do wychwycenia kontekstu, sytuacji) rokuje szansę na powstanie skutecznej i elastycznej w działaniu wyszukiwarki obiektów graficznych. Inna metodą na połączenie warstwy znaczeniowej (jako najbardziej naturalnej dla człowieka metody opisu) z warstwą cech przedmiotu (taki opis jest z kolei "zrozumiały" dla komputera) jest użycie swoistych opisów-szablonów skojarzonych z konkretnymi typami grafik. W takim przypadku system, przeanalizowawszy wprowadzony przez użytkownika opis obrazu, dostosowuje go do określonej kategorii grafik (takich jak zwierzęta, ciężarówki, czy starsi mężczyźni w okularach) na podstawie występowania w opisie określonych słów kluczowych.

Wyniki (bez względu na typ wykorzystywanej metody wyszukiwania) mają postać listy gromadzącej miniaturowe odwzorowania odnalezionych w Sieci obrazków, wraz z opisami i odnośnikami do miejsca, z którego pochodzą. Sekwencje filmowe rozbijane są na ciąg klatek kluczowych (ang. keyframes), tak by dać odbiorcy jakiekolwiek pojęcie na temat zawartości filmu.

PRZYSZŁOŚĆ

Systemy tego typu wciąż znajdują się w początkowej fazie rozwoju i na razie stanowią bardziej ciekawostkę, niż prawdziwie efektywne narzędzie pracy. Prawdopodobne jest to, że przyszłość takich wyszukiwarek należy do systemów kontekstowych, rozpoznających opis zbliżony do mowy potocznej. Duże nadzieje pokłada się również w tzw. systemach ekspertowych, które mogą stanowić klucz do budowy wydajnych i skutecznych systemów katalogujących. Jednak obecnie najskuteczniejszą metodą pozwalającą odnaleźć interesującą grafikę jest posłużenie się "normalnymi" tekstowymi wyszukiwarkami. Większość z nich potrafi zawęzić pole wyszukiwania do określonego typu danych - może to być grafika (statyczna) lub sekwencja wideo.

Warto wspomnieć o innym, ciekawym zastosowaniu metod rozpoznawania obrazów w Internecie - czyli narzędziach elektronicznej cenzury, wspomagających "odsiewanie" zdjęć erotycznych.

SYSTEMY WYSZUKIWANIA GRAFIKI:

Webseek

http://www.ctr.columbia.edu/webseek/

VisualSeek

http://disney.ctr.columbia.edu:8021/VisualSEEk/

VideoQ

http://www.ctr.columbia.edu/VideoQ/

WebClip

http://www.ctr.columbia.edu/cveps/overview.html

Image Recognition Laboratory

http://www.uni-ko-ld.de/~lb/i/e


Zobacz również