Konkurs czytania

Po co żmudnie wklepywać tekst z kartki do edytora tekstu lub dane z tabeli do arkusza kalkulacyjnego, jeśli może to za Ciebie zrobić program optycznego rozpoznawania znaków OCR, na przykład FineReader 5.0 Pro lub Readiris Pro 6, który nie tylko rozpozna, ale nawet wiernie odwzoruje układ dokumentu wraz z ilustracjami.

Po co żmudnie wklepywać tekst z kartki do edytora tekstu lub dane z tabeli do arkusza kalkulacyjnego, jeśli może to za Ciebie zrobić program optycznego rozpoznawania znaków OCR, na przykład FineReader 5.0 Pro lub Readiris Pro 6, który nie tylko rozpozna, ale nawet wiernie odwzoruje układ dokumentu wraz z ilustracjami.

Oba programy otrzymaliśmy w angielskojęzycznych wersjach, co nie jest przeszkodą przy rozpoznawaniu polskich dokumentów. Aplikacje te są wyposażone w obszerne polskie słowniki i doskonale radzą sobie z rozpoznawaniem charakterystycznych dla naszego języka pisanego "ogonków". Na ukończeniu są już prace nad polskimi wersjami obu programów. Powinny się pojawić na rynku w pierwszym kwartale tego roku.

Można powiedzieć, że FineReader 5.0 Pro i Readiris Pro 6 obecnie są jedynymi programami OCR rozpoznającymi polski, zważywszy, że najsławniejsza Recognita 5 nie będzie już rozwijana, a TextBridge osiągalny jest jedynie w zestawach ze skanerami.

Readiris Pro 6

Po zainstalowaniu od razu rzuca się w oczy prosty, uporządkowany i przy-jazny dla użytkownika interfejs, co na pewno zaoszczędzi stresu osobom po raz pierwszy stykającym się z tematem optycznego rozpoznawania znaków. Mogą także skorzystać z samouczka znajdującego się w podręczniku programu i z kreatora prowadzącego użytkownika krok po kroku przez proces przetwarzania dokumentu.

Program rozpoznaje tekst w 56 językach. Dzięki zawartym w aplikacji słownikom Readiris Pro 6 odczytuje nie tylko pojedyncze znaki, ale całe wyrazy.

Program współpracuje z dowolnymi skanerami, w tym również z wykorzystującymi uniwersalną technologię TWAIN. Możliwe jest także wprowadzanie dokumentów w postaci plików graficznych. Akceptowane są formaty JPG, TIF, PCX i BMP.

Wynik przetwarzania dokumentu jest umieszczany bezpośrednio w edytorze tekstu lub arkuszu kalkulacyjnym, lub może być zapisany jako plik tekstowy ACSII, RTF lub XLS.

Dzięki nowemu, w stosunku do wersji poprzednich, mechanizmowi odczytywania możliwe było znaczne podniesienie prędkości rozpoznawania i zmniejszenie liczby błędów. Nowy Readiris rozpoznaje tekst kolorowy, także umieszczony na kolorowym tle.

Wykorzystując technologię automatycznego formatowania, potrafi odtworzyć pierwotny układ dokumentu wraz tabelami i ilustracjami np. w edytorze tekstu MS Word.

W trakcie procesu program z pomocą użytkownika może się "uczyć" rozpoznawania nieznanych mu znaków. Użytkownik ma także możliwość poprawiania na bieżąco błędów, co wpływa na zwiększenie poprawności rozpoznania.

Readiris 6 Pro podczas analizy strony automatycznie rozpoznaje tabele, umieszczając je w zbliżonej postaci w arkuszu kalkulacyjnym lub edytorze tekstu. Podczas współpracy ze skanerami wyposażonymi w automatyczny podajnik papieru ADF doskonale radzi sobie z przetwarzaniem dokumentów wielostronicowych (tzw. batch OCR), zapisując wyniki rozpoznania w jednym pliku.

W komplecie z Readirisem Pro 6 dostarczana jest także wersja Lite programu Cardiris umożliwiająca przetwarzanie danych z wizytówek i gromadzenie ich w bazie informacji osobowych.

Do testu użyliśmy plików TIF i BMP z zeskanowanymi tabelami, złej jakości dokumentami faksowymi, a także fragment strony z kolorowego magazynu o skomplikowanym układzie ilustracji, kilkoma rodzajami czcionek i tle z nałożoną teksturą. Wszystkie dokumenty były zeskanowane na tym samym skanerze z rozdzielczością 300 dpi, przy czym dokumenty faksowe były skanowane w trybie monochromatycznym, dokumenty z tabelami w 256 odcieniach szarości, a strona z magazynu w 24-bitowym kolorze.

Readiris Pro 6 charakteryzuje się niesamowitą prędkością przetwarzania dokumentów. Na rozpoznanie jednej strony A4 w zależności od stopnia komplikacji potrzebował od 3 do 7 sekund (nie licząc czasu wczytywania edytora tekstu lub arkusza kalkulacyjnego oraz czasu, w którym użytkownik może uczyć program odczytywania znaków).

Zdecydowanie najlepiej program poradził sobie z tabelami, uzyskując 99-procentowy wynik poprawności rozpoznania. Nieco gorzej poszło mu przetwarzanie dokumentów faksowych ze względu na zniekształcenia liter oraz charakterystyczne dla faksu zabrudzenia. Wprawdzie opcja prostowania położenia dokumentu Deskew ułożyła stronę pra-widłowo, ale do uzyskania najlepszego wyniku rozpoznania była wymagana interwencja użytkownika. Polegała ona na poprawianiu wyglądu dokumentu za pomocą funkcji Despeckle przez usuwanie niepotrzebnych punktów obrazu. Ostatecznie udało się uzyskać poprawność rozpoznania dokumentu bliską 90 procentom.

Zdecydowanie najwięcej problemu miała aplikacja z rozpoznaniem dokumentu kolorowego, a szczególnie bloków tekstu umieszczonych na pokrytym teksturą podkładzie. Tu także była wymagana interwencja użytkownika, ponieważ część tekstu była rozpoznawana przez program jako ilustracje. Udało się skorygować ten błąd, regulując ręcznie jasność obrazu w sekcji Adjust image. Konieczne też było ręczne oznaczenie bloków tekstu, gdyż automatyczna analiza strony do tekstu zaliczyła także jego graficzne ozdobniki. Ostatecznie udało się uzyskać około 85-procentową poprawność rozpoznania i zachowanie układu strony w edytorze tekstu.

FineReader 5.0 Pro

Dokładność rozpoznawania dokumentów w wersji 5.0 programu wzrosła w niektórych wypadkach nawet dwukrotnie. FineReader 5.0 rozpoznaje obecnie 176 języków, w tym także lis-tingi języków programowania takich jak Basic, C/C++, COBOL, Fortran, JAVA i Pascal. Nie ma również problemu z rozpoznawaniem znaków w indeksie górnym i dolnym, co często spotykane jest np. w formułach matematycznych i chemicznych, jak i tekstu w układzie pionowym. Rozpoznawanie tekstu wspomagane jest przez 30 wbudowanych słowników (w tym także słownik języka polskiego).

FineReader 5.0 Pro zarówno współpracuje ze wszystkimi skanerami

korzystającymi z technologii TWAIN, jak i umożliwia wczytywanie obrazów w postaci plików graficznych w formatach: BMP, PCX, DCX, JPG, PNG i TIF (także TIF-y wielostronicowe).


Zobacz również