OCR (Optical Character Recognizing)~ optische tekenherkenning is een techniek die zijn oorsprong vindt in de begin jaren 80. OCR is de techniek die gebruikt wordt om gescande documenten te voorzien van een tekstlaag. In de loop der jaren is de techniek verfijnd en zijn er verschillende variaties opgekomen, de OCR techniek is beter bekend en ook geschikt voor de normale gebruiker.


1 Basics

1.1 Wat is OCR

OCR (optische tekenherkenning) is een techniek die gebruikt wordt om gescande documenten te voorzien van een tekstlaag. Doordat het document een tekstlaag heeft, kan het in zijn geheel of gedeeltelijk hergebruikt worden. Daarnaast is een gescand document met een tekstlaag ook doorzoekbaar via verschillende zoekfuncties.

1.2 Doel van OCR

Het zorgen dat een document een tekstlaag krijgt voor hergebruik van tekst, of het doorzoekbaar maken van het gescande document.

1.3 Voordelen van OCR

Het grootste voordeel van het OCR’en van documenten is dat documenten op de ge-ocr-de tekst doorzocht kunnen worden. Op die manier kunnen organisaties doorgroeien naar een meer digitale organisatie, zonder verlies van functionaliteit op gescande documenten. Ook kunnen meer specialistische vormen van OCR gebruikt worden zoals handschriftherkenning (ICR), formulierherkenning (OMR) en factuurherkenning.

2 Oplossingen

OCR is een techniek en menig leverancier heeft oplossingen, op eenvoudig gebruikers- niveau heeft Adobe Standaard en Professional een OCR functie ingebouwd. Ook wordt op menig scanner standaard OCR software meegeleverd en kunnen sommige multifunctionals ook geleverd zijn met een OCR module. Er zijn er een aantal grote OCR leveranciers die voor alle type scanners en type OCR behoefte een oplossing verkopen.

2.1 Business Case

Het scannen van documenten, het leidend maken van een digitaal dossier/project, het opruimen van papierenarchieven. Het doorzoekbaar maken van documenten zijn allemaal business cases die de laatste jaren door veel bedrijven zijn opgepakt en die allemaal een kostenbesparend karakter hebben. OCR is een onderdeel van deze business cases om zo het optimale rendement uit het digitale dossier, archief of het gescande document te halen.

2.2 Aandachtspunten en valkuilen

Een belangrijk aandachtspunt voor het gebruik van OCR is dat de kwaliteit van het gescande document de kwaliteit van de tekstherkenning bepaald. Dus een goede scanner is erg belangrijk en mag niet onderschat worden.

Denk niet alleen het OCR- en van gescande documenten op een centrale scanner, veel multifunctionals die worden gebruikt in een organisatie OCR- en niet de gescande documenten.

Houdt er rekening mee dat er tegenwoordig een hoop tiff (faxen) en PDF bestanden via de e-mail ontvangen worden, deze bestanden worden op het netwerk of in een ECM/DM systeem opgeslagen. In heel veel gevallen zijn de binnengekomen documenten niet ge-ocr-ed.

2.3 Voorbeelden

Voorbeelden OCR zijn overal te vinden van een thuisscanner tot aan hoog volume scanners die miljoenen documenten scannen. Het belangrijkste is bewust te zijn van het feit dat niet ge-ocr-de documenten een risico zijn voor de organisatie. Als documenten niet meer gevonden of hergebruikt kunnen worden, wat is het nut nog van deze documenten.

2.4 Aanpak

Inventariseer in een organisatie eerst de scanbronnen: multifunctionals, copiers, hoog volume scanners, input vanuit e-mail, fax servers etc.

Bepaal welke scanbronnen al een OCR functie hebben, bepaal welke scanbronnen geen OCR functie hebben. Vanuit deze opzet kan er gekeken worden naar bijvoorbeeld een centrale OCR server die verbonden wordt met alle scanbronnen.

3 Verder lezen

http://nl.wikipedia.org/wiki/Optical_character_recognition

http://www.iriscorporate.com/c2-646-189/I-R-I-S—-OCR-software-and-Document-Management-solutions.aspx

http://www.linkedin.com/news?home=&gid=116054&trk=anet_ug_news

4 Over de auteur

Sebastiaan Bos is Business Unit Manager I.R.I.S. Nederland

Wilt u zelf ook een informatiebulletin voor beginners aanleveren? Stuur uw 101 artikel naar redactie@docufacts.nl

Rate this post

Print Friendly