Komputery zaczynają czytać z ruchu warg

Stereoskopowy kod opracowany przez naukowców Intela pozwala komputerom 'widzieć' obrazy trójwymiarowe, co oznacza np. możliwość tworzenia aplikacji pozwalających komputerom rozpoznawać gesty i czytać z ruchu warg.

Opracowany przez Intela nowy kod programowy pozwala komputerom 'widzieć w 3D', co według jego twórców, doprowadzi do rozwoju nowego typu interakcji człowieka z komputerem. Do tej pory 'aplikacje wizji' ograniczone były do dwóch wymiarów i komputer rozpoznawał sceny jako pojedyncze, płaskie, kolorowe pola. Nowy kod Intela umożliwia widzenie stereoskopowe i pozwala komputerom rozpoznawać zarówno obrazy 'z głębią', jak i 'płaskie' oraz wydzielać pojedyncze obiekty i powierzchnie ze sceny. Kod opublikowany został jako 'open standard' na podstawie którego mogą być tworzone komercyjne aplikacje wizji przeznaczone np. do rozpoznawania gestów czy śledzenia ruchów obiektów. W przyszłości technologie tego typu mogą prowadzić do stworzenia bardziej zaawansowanych metod programowania komputerowych interfejsów, doskonalszych biometrycznych systemów bezpieczeństwa czy wydajniejszych technik produkcji robotów i eksploracji przestrzeni kosmicznej.

Według Intela, w ciągu najbliższych 10 lat komputerowe systemy wizji odegrają znaczącą rolę w procesie upraszczania interakcji pomiędzy człowiekiem i komputerem 'Pragniemy uczynić komputery świadomymi wizualnego świata, ale do czasu opracowania OpenCV, brak powszechnych narzędzi uniemożliwiał rozwój prac nad takimi systemami wizji', twierdzi Justin Rattner, dyrektor Microprocessor Research w Intel Labs. OpenCV albo Open Source Computer Vision Library to właśnie opublikowane przez Intela narzędzie źródłowe, udostępniające kod stereoskopowy zainteresowanym programistom pragnącym komercyjnie zastosować komputerowe systemy wizji. Intel spodziewa się, że udostępnienie kodu i innych źródeł biblioteki doprowadzi do powstania aplikacji rozpoznawania rysów twarzy, kalibracji kamery, systemów śledzenia ruchu czy identyfikacji obiektów, tworzonych przez producentów PC, kamer cyfrowych i firmy programistyczne. Zdaniem Intela, czynniki takie jak coraz szybsze procesory, spadek cen kamer cyfrowych oraz wzrost przepustowości interfejsów przechwytywania wideo (np. USB 2.0) umożliwiają działanie algorytmów systemów wizji 'real-time' na standardowych komputerach PC. Biblioteka OpenCV Intela to zestaw 500 wizyjnych funkcji i aplikacji dostępnych w wersjach dla Windows i Linux, rozpowszechniana darmowo do użytku komercyjnego i edukacyjnego.

http://www.intel.com


Zobacz również