Cyfrowe czytanie


TextBridge Pro 9

Cyfrowe czytanie
TextBridge Pro 9 jest osiągalny, podobnie jak OmniPage, tylko jako dodatek do skanerów sprzedawanych Polsce (np. skanerów Agfa). Jednak w przeciwieństwie do OmniPage, wśród pięćdziesięciu sześciu rozpoznawanych języków jest także polski. Aplikację wyposażono w przyjazny użytkownikowi, łatwy w obsłudze interfejs, niestety, tylko w języku angielskim.

Aplikacja bez problemu rozpoznaje skomplikowane formy (dokumenty wieloszpaltowe, tabele, kolorowe ilustracje, nagłówki i stopki, elementy ozdobne) i potrafi zapisać dokument w postaci

cyfrowej z zachowaniem wszystkich tych elementów oraz oryginalnego układu strony. TextBridge Pro 9.0 rozpoznaje także tekst umieszczony na kolorowym lub pokrytym teksturą tle.

Jedną z ciekawszych cech aplikacji jest możliwość zapisu rozpoznanego dokumentu w pliku PDF. TextBridge Pro 9.0 oferuje także możliwość zapisywania dokumentów po rozpoznaniu w formacie HTML, umożliwiając nawet dodanie łączy internetowych do różnych elementów dokumentu, w tym elementów graficznych.

Aplikacja współpracuje z oprogramowaniem zarządzającym dokumentami, m. in. z Pagis Pro 2.0, PaperPort Deluxe i PaperPort Scanner Suite.

TextBridge Pro 9.0 wyposażony jest w technologię AccuMorph, znacznie zwiększającą wydajność programu w rozpoznawaniu dokumentów złej jakości (faksy, kserokopie z zanieczyszczeniami). Polega ona na częściowej odbudowie obrazów zniekształconych znaków i dopasowanie ich do wzorców.

W programie zaimplementowano także opcje ułatwień dla użytkowników, jak choćby kreator skanowania, będący swego rodzaju instrukcją takiego korzystania ze skanera, aby osiągnąć najlepsze efekty. Ułatwieniem jest także system pomocy w postaci interaktywnego agenta, wykorzystujący technologię Microsoftu znaną chociażby z pakietu MS Office.

Terminarz zawarty w programie umożliwia zorganizowanie rozpoznawania dużych dokumentów (co długo trwa) bez udziału użytkownika.

TextBridge Pro 9.0 integruje się z popularnymi aplikacjami biurowymi jak Word 97, Word 2000, Ami Pro, Word Pro, WordPerfect, Excel 97, Excel 2000, Lotus 1-2-3, NotePad, i Paint, pozwalając użytkownikom na bezpośredni dostęp do OCR z poziomu tych aplikacji.

SharpEye 1.06

Cyfrowe czytanie
Coś dla muzyków. Program OCR rozpoznający zapis nutowy. Opisujemy go tu raczej jako dość egzotyczną aplikację, mającą jednak dużą wartość dla osób zajmujących się komponowaniem muzyki. Program bowiem potrafi skonwertować dokument nutowy (zapis na pięciolinii) bezpośrednio do pliku MIDI, który może być użyty np. do komponowania utworu.

SharpEye ma wbudowany edytor znaków muzycznych, specjalnie zaprojektowany do sprawdzania i korygowania danych po rozpoznaniu, zanim zostaną zapisane w pliku MIDI.

Aplikacja nie współpracuje, niestety. z żadnym ze skanerów, dlatego użytkownik musi przygotować pliki graficzne BMP lub TIF za pomocą współpracującego ze skanerem programu graficznego.

Producent programu zapewnia, że dobrej jakości zapis nutowy, zeskanowany z rozdzielczością 300 dpi będzie rozpoznany z 99-procentową dokładnością.

Mały test

Każdy z opisanych programów OCR, z wyjątkiem SharpEye (z powodów oczywistych), testowaliśmy. Zeskanowaliśmy stronę złej jakości dokumentu faksowego, ustawiliśmy w każdym z programów maksymalny poziom dokładności rozpoznawania i sprawdziliśmy, ile błędów każdy z nich popełni podczas rozpoznawania. Zaznaczę tylko, że poprzeczka była ustawiona dość wysoko, jako że tekst znajdował się na papierze termoczułym, był bardzo pożółkły w wyniku działania światła słonecznego i miał dwie tłuste plamy o średnicy około 3 cm i 1,5 cm. Wyniki, które otrzymaliśmy, podajemy w procentach i określają one stopień poprawności rozpoznania; sto procent oznacza dokument rozpoznany bez żadnych błędów i poprawek ze strony użytkownika.

Finereader 4.0 Handprint -74,1%

Recognita Plus 5.0 -73,8 %

Finereader 4.0 Professional PL -73,2 %

Readiris 5.0 - 68,2 %

TextBridge Pro 9.0 - 64,7 %

OmniPage Pro 10 - 42,5 % *

* Słaby wynik związany jest z tym, że program nie rozpoznał polskich znaków diakrytycznych, natomiast pozostałe znaki łacińskie rozpoznał na równi z programami FineReader i Recognita.

Najnowszym programom już niewiele brakuje do doskonałości. Nadal jednak bardzo trudnym zadaniem dla OCR-ów jest rozpoznawanie ręcznego (nie umieszczonego w kratkach) pisma. A wiadomo Đ tyle charakterów pisma, ilu ich właścicieli. Zatem grafolodzy mogą spać spokojnie, bo jeszcze długo nie będzie im grozić bezrobocie.