W przypadku wprowadzania do systemu elektronicznego dokumentów papierowych, jednym z najistotniejszych zadań jest odpowiednie opisanie (indeksowanie) obrazu każdego obrazu dokumentu. Ponieważ obrazy te zapisywane są w postaci plików graficznych - bez powiązania ich z odpowiednimi atrybutami - późniejsze odszukanie tych plików jest praktycznie niemożliwe lub bardzo utrudnione. Aby ułatwić indeksowanie dokumentu lub przekształcić zawarty w nim tekst do postaci tekstowej (łatwo interpretowanej przez system), wykorzystuje się mechanizmy rozpoznawania tekstu drukowanego (OCR) lub pisma ręcznego (ICR).

Mechanizmy rozpoznawania pisma ręcznego (ICR) sprawdzają się obecnie jedynie do o odczytu pisma blokowego (litery drukowane) i nie zapewniają dokładności zbliżonej do mechanizmów odczytu tekstu drukowanego (OCR). Mimo ograniczeń związanych z koniecznością korygowania błędnych wyników odczytu - systemy takie w znacznej mierze eliminują nakłady związane ze żmudnym przepisywaniem całości lub fragmentu tekstu zawartego w dokumencie.

Najczęstsze zastosowania technologii OCR/ICR to:

  • Możliwość pobrania tekstu z obrazu dokumentu papierowego i zapisanie go w postaci umożliwiającej edycję w dowolnym edytorze tekstów (np. MS Word). Pozwala to na wykorzystanie rozpoznanego tekstu przy tworzeniu nowego dokumentu - bez konieczności przepisywania,
  • Wprowadzanie tekstu do dowolnej bazy umożliwiającej przeszukiwanie pełno-tekstowe, a więc wyszukiwanie dokumentu na podstawie jednego, lub kilku słów kluczowych zawartych w tekście. Wpływa to znacząco na późniejszą możliwość odszukania potrzebnej informacji i wyświetlenie obrazu poszukiwanego dokumentu,
  • Wprowadzanie informacji zawartych w kwestionariuszach, ankietach i formularzach papierowych do standardowej bazy danych. Dzięki temu możliwa jest późniejsza aktualizacja, edycja i analiza tych danych wykorzystywana najczęściej do takich zastosowań jak : ewidencja osób i przedmiotów, programy lojalnościowe, akcje marketingowe,
  • Automatyczna identyfikacja dokumentu, a więc odczyt niektórych danych (np. nazwy kontrahenta, numeru lub daty dokumentu, itp.) i zamiana ich na atrybuty przypisane do obrazu dokumentu dla zapewnienia łatwiejszego wyszukiwania i filtrowania dokumentów w dowolnym systemie. W szczególności możliwe jest także kwalifikacja dokumentu na podstawie zdefiniowanych reguł i zależności między poszczególnymi wyrazami.

w górę strony