Cyfrowe czytanie


Fine Reader 4.0 Handprint

Cyfrowe czytanie
Aplikacja jest rozwinięciem wersji 4.0 Professional. Jej podstawowa właściwość to umiejętność rozpoznawania pisma ręcznego blokowego, tj liter pisanych w osobnych kratkach. Co najistotniejsze, rozpoznaje także polskie znaki. Fine Reader 4.0 Handprint ma dobrze rozwiniętą technikę rozpoznawania różnego typu formularzy. Umożliwia również definiowanie reguł integralności, łączenie pól, zmianę wartości pól według podanych reguł, a także eksport rozpoznawanych fragmentów.

Obsługa programu Fine Reader 4.0 Handprint jest prawie taka sama jak wersji Professional i Standard, z tą różnicą, że jeszcze nie ma wersji z polskojęzycznym interfejsem użytkownika.

Readiris 5.0

Cyfrowe czytanie
Starsze wersje Readiris znajdziemy dołączone do niektórych skanerów.

Program jest przyjemny w obsłudze, choć mógłby mieć ładniejszy interfejs użytkownika. Rozpoznaje pięćdziesiąt pięć języki, w tym polski. Niestety, wszystkie komunikaty i interfejs użytkownika są w języku angielskim.

Mimo to Readiris 5.0 ma kilka funkcji ułatwiających życie. Jedną z nich jest uruchamianie skanowania i rozpoznawania za pomocą jednego przycisku. Inną jest kreator OCR, który niedoświadczonych użytkowników przeprowadza krok po kroku przez proces skanowania i rozpoznawania dokumentu.

W trakcie rozpoznawania Readiris 5.0 nie tylko wyodrębnia litery ze

skanowanego obrazu, ale również analizuje całe wyrazy, porównując je ze słownikiem. Kombinacje liter są weryfikowane specjalnymi modułami leksykalnymi, zawierającymi reguły budowy słów w danym języku.

Rozpoznaje układ tekstu w postaci tytułów, nagłówków i kolumn na stronie, ponadto tabele, tekst w negatywie oraz różne kroje i wielkości czcionek w przedziale od 6 do 72 pkt. Rozpoznany dokument może być przesłany wprost do edytora MS Word lub WordPad albo zapisany w pliku RTF z zachowaniem oryginalnego układu elementów w dokumencie.

Mocną stroną Readiris 5.0 są funkcje uczenia się i podejmowania decyzji. Program uczy się w miarę rozpoznawania tekstu i robi to lepiej niż jego konkurenci. Niestety, w związku z tym konieczna jest obecność użytkownika, gdyż aplikacja w razie wątpliwości prosi o potwierdzenie wariantu rozpoznania.

Z czasem staje się jednak coraz szybszy i dokładniejszy.

OmniPage Pro 10

Cyfrowe czytanie
OmniPage Pro 10 to najnowsza wersja sztandarowego programu OCR firmy Caere. W Polsce OmniPage znany jest tylko jako bezpłatny dodatek do skanerów stołowych sprzedawanych przez niektóre firmy. Nowy mechanizm rozpoznawania w tym programie jest połączeniem technologii znanych z trzech aplikacji: OmniPage Pro, WordScan Plus i Recognita Plus trzech dominujących na rynku firm, co znacznie zwiększyło jego wydajność.

Niestety, OmniPage Pro 10 nie ma polskiego interfejsu, systemu pomocy i nie rozpoznaje polskiego języka, co znacznie obniża jego wartość w oczach rodzimego użytkownika. Rozpoznaje za to wszystkie języki Europy Zachodniej, a producent zapewnia, że robi to z 99-procentową poprawnością.

Program oferuje dwie opcje ułatwiające życie użytkownikowi. Pierwsza z nich to przycisk Auto, całkowicie automatyzujący proces skanowania i rozpoznawania.

Rola użytkownika sprowadza się w zasadzie do włożenia oryginalnego dokumentu do skanera i zapisania pliku wynikowego. Druga opcja to kreator, który zadając proste pytania, znacznie ułatwi pracę niedoświadczonym użytkownikom, a jednocześnie pomoże uzyskać jak najlepsze efekty. Program zawiera także samouczek, który w zasadzie eliminuje konieczność korzystania z instrukcji obsługi.

Program współpracuje z popularnymi edytorami tekstu do Windows, w tym z MS Word, do tego stopnia, że korzysta nawet z jego słownika.

W OmniPage 10 w stosunku do wersji 9 wprowadzono wiele nowych właściwości. Najistotniejsza jest nowa technika rozpoznawania, polegająca na dwukrotnym określaniu stref i ich wstępnym rozpoznawaniu. Nowością jest także udoskonalona technologia wewnętrznego modelowania czcionki, co z kolei znacznie usprawniło dopasowywanie obrazów znaków do ich odpowiedników.

Inną ciekawą właściwością jest możliwość ustawienia aplikacji w taki sposób, aby automatycznie skanowała dokumenty z regularnymi przerwami (np. co 50 sekund) za pomocą skanera wyposażonego w automatyczny podajnik papieru. Znacznie upraszcza to rozpoznawanie dokumentu wielostronicowego.

OmniPage Pro 10 zawiera moduł OmniPage Web Personal Edition, pozwalający użytkownikowi na konwersję wielostronicowego dokumentu (do dziesięciu stron) bezpośrednio na dokument w języku HTML.