Oprogramowanie - widzi, analizuje, "rozumie"

Amerykańscy naukowcy stworzyli program, który potrafi automatycznie opisywać (tagować) grafiki na podstawie ich zawartości. Co ciekawe, aplikacji udało się "wywnioskować" przynajmniej jeden właściwy tag w przypadku 98 procent zdjęć spośród wybranych z serwisu Flickr!

Nad podobnym oprogramowaniem pracują największe firmy na świecie, od Microsoftu i Google poczynając, na IBM i Motoroli kończąc. Nie od dziś wiadomo jednak, że o ile komputery całkiem nieźle radzą sobie z rozpoznawaniem tekstu, o tyle nauczenie ich kojarzenia słów z obrazami wcale nie jest takie proste - choćby dlatego, że ciągle nie znamy mechanizmów rządzących umysłem człowieka podczas tego procesu.

ALIPR = przełom?

Stworzona w Stanach Zjednoczonych aplikacja nosi nazwę ALIPR (Automatic Linguistic Indexing of Pictures). Opracowali ją dwaj naukowcy: Jia Li z Pennsylvania State University i James Wang z College of Information Sciences and Technology.

Jak tłumaczy pani Li, fotografia to płaski rzut trójwymiarowego przedmiotu, dlatego ten sam obiekt może wyglądać na tysiące różnych sposobów.

ALIPR analizując obraz sprawdza, czy "plama" mogłaby być przedmiotem, do którego posiada pasujące słowo - podczas badania korzysta z 50 tysięcy otagowanych przez człowieka grafik przechowywanych w jego własnej bazie danych.

W procesie brany jest pod uwagę m.in. kolor i faktura powierzchni "plamy".

Statystyki są bardzo interesujące: program nie tylko znajduje przynajmniej jeden właściwy opis dla niemal wszystkich grafik. W połowie (51 procent) obrazków pierwsze zaproponowane słowo kluczowe było identyczne z tym, którego użył twórca zdjęcia!

Warto zajrzeć: witryna ALIPR


Zobacz również