Czyta cytaty

Gdy masz skaner i dobry program do rozpoznawania pisma (OCR), przeniesienie treści dokumentów papierowych do komputera staje się kwestią paru minut.

Gdy masz skaner i dobry program do rozpoznawania pisma (OCR), przeniesienie treści dokumentów papierowych do komputera staje się kwestią paru minut, a Ty musisz właściwie tylko przekładać kartki w skanerze. Na rynku liczą się w zasadzie tylko trzy programy OCR. Jednym z nich jest Readiris firmy I.R.I.S. Jego najnowszą wersję 5.0 sprawdziliśmy w boju.

By Readiris działał sprawnie, musisz mu pomóc w nauce literek.

By Readiris działał sprawnie, musisz mu pomóc w nauce literek.

Do niedawna programy OCR rozpoznawały jedynie druki o najprostszym układzie graficznym: czcionki o zwykłym kroju i w miarę stałej wielkości oraz ułożeniu w jednej kolumnie na stronę. Najnowsze wersje aplikacji OCR przenoszą do komputera tekst z zachowaniem jego rozmieszczenia na stronie i dołączoną grafiką. Można więc uzyskać wierną kopię np. strony z gazety zapisaną jako plik tekstowy (z formatowaniem).

Tak też jest w przypadku Readirisa 5.0 Pro. Oprócz ułożenia tekstu w postaci tytułów, nagłówków i kolumn na stronie rozpoznaje również tabele, tekst w kontrze (jasny na czarnym tle), kursywę oraz różne wielkości czcionek (od 6 do 72 pkt). Odczytany dokument wysyła prosto do Worda lub WordPada, bądź zapisuje do pliku w formacie RTF, zachowując wygląd strony. Tabele zaś można, poprzez schowek lub plik, wczytywać do arkuszy kalkulacyjnych takich jak Excel.

W oknie Text Format określasz parametry danych wyjściowych.

W oknie Text Format określasz parametry danych wyjściowych.

Wielką zaletę Readirisa 5.0 stanowi moduł lingwistyczny obsługujący aż 55 języków, w tym polski (a także rosyjski, grecki, japoński czy chiński). Jednak największa siła programu leży w funkcjach uczenia się i podejmowania decyzji: Readiris staje się "mądrzejszyŇ z każdym kolejnym rozpoznawaniem tekstu. W razie wątpliwości pyta bowiem użytkownika, czy właściwie interpretuje znaki, a odpowiedź zapamiętuje na przyszłość.

Chrzest bojowy

Instalacja Readirisa 5.0 Pro zaczyna się komunikatem po polsku, ale później mamy do wyboru już tylko 6 najważniejszych języków europejskich. Program jest od razu gotowy do użytku, obsługuje wiele konkretnych modeli skanerów (szczególnie HP), a pozostałe poprzez TWAIN.

Po uruchomieniu aplikacji automatycznie włącza się OCR Wizard - kreator skanowania dokumentu dla nowicjuszy. Pyta o rodzaj źródła (plik graficzny czy skaner), ustawienia skanera (jeśli jest źródłem), język obrabianego dokumentu i na koniec daje możliwość zmiany ustawień pliku wyjściowego. Po kliknięciu Go rozpoczyna się automatyczny proces skanowania, dekompozycji obrazu i rozpoznawania pisma. Następnie Readiris przechodzi do etapu nauczania, w którym użytkownik żmudnie akceptuje (Learn), odrzuca (Don't Learn), poprawia lub w ogóle usuwa (Delete) propozycje programu. Po rozwianiu wszelkich wątpliwości wyjściowy plik "ląduje" - w zależności od ustawień - na dysku lub np. w Wordzie 97.

Kreator OCR jest doskonały dla osób początkujących, ale automatyczna dekompozycja nie zawsze przynosi dobre rezultaty, bo program czasem mylnie interpretuje bloki graficzne jako tekstowe. Wystarczy, by w ilustracji znalazły się litery, a nadgorliwy Readiris od razu je przechwytuje! W ten sposób program "przeczytał", m.in., zrzuty ekranów w testowych dokumentach.

Warto więc przejąć inicjatywę i odrobinę ostudzić zapędy aplikacji, zwłaszcza, że jest to wyjątkowo proste. Wszystkie ustawienia, o które pyta Kreator, są dostępne poprzez narzędzia z lewej strony ekranu Readirisa.


Zobacz również