IMPACT-project verbetert toegang tot historische teksten dankzij technologische innovatie en samenwerking

München (8 juni 2011) — ABBYY, toonaangevend leverancier van technologieën voor documentherkenning, vastlegging van gegevens en taalkundige oplossingen, maakt de eerste resultaten bekend van de deelname aan IMProving ACcess to Text (IMPACT); een project van de Europese Commissie. ABBYY zet zijn Optical Character Recognition (OCR)-software en expertise op het gebied van herkenning van historische lettertypen in voor dit onderzoeksproject. Hiermee wordt het gedrukte erfgoed van Europa omgezet in beschikbare digitale informatie. Door de ervaring die ABBYY tijdens dit vierjarige project heeft opgedaan, is het bedrijf in staat om oplossingen te leveren gebaseerd op de meest geavanceerde technologie voor tekstherkenning in gedrukte historische documenten.

Aan het IMPACT-consortium nemen 26 Europese nationale en regionale bibliotheken, onderzoeksinstellingen en technologiepartners deel. Zij wisselen kennis en best practices uit en ontwikkelen innovatieve tools voor het verbeteren van de mogelijkheden van OCR-engines. Tegen het einde van 2011 is de toegang tot historische teksten van vóór 1900 aanzienlijk zijn verbeterd. Gezamenlijke inspanningen op het gebied van onderzoek en ontwikkeling vormen een belangrijke schakel in de digitalisering van het Europese culturele erfgoed.

ABBYY vervult sinds 2008 een sleutelrol binnen het IMPACT-project door de geleverde state-of-the-art OCR-technologie en expertise voor het digitaliseren van historische lettertypen en het ophalen van tekst uit oude documenten. De OCR-technologie van ABBYY leent zich bij uitstek voor de herkenning van tekst in afbeeldingen van documenten, met uiteenlopende historische lettertypen. Hierdoor is het mogelijk om deze schat aan informatie volledig te digitaliseren, doorzoekbaar te maken en te integreren met systemen die worden gebruikt voor het opbouwen van lexicons.

De onderzoeks- en ontwikkelingsteams van ABBYY hebben nauw samengewerkt met strategische betrokkenen binnen de projectteams van IMPACT om een oplossing te vinden voor belangrijke technologische problemen waarmee bibliotheken worden geconfronteerd tijdens grote digitaliseringsprojecten. Aan de hand van historisch relevante proefmonsters die door gerenommeerde Europese bibliotheken werden verzameld, heeft ABBYY nieuwe technologische verbeteringen ontwikkeld met betrekking tot het voorbewerken van afbeeldingen en het analyseren van documentindelingen voor betere resultaten op het gebied van tekstherkenning.

“In het verleden ontbrak het OCR-software aan geavanceerde functies voor een doeltreffende conversie van gescande pagina’s in platte tekst of XML-formaat. Dit gold met name voor oude boeken, tijdschriften en kranten,” aldus Aly Conteh, bestuurslid van het IMPACT-project en manager van het digitaliseringsprogramma van de British Library. “Dankzij onze deelname aan het IMPACT-project kunnen we beschikken over de uiterst geavanceerde OCR-technologie van ABBYY, die projectdeelnemers in staat stelt om documenten van een vaak slechte kwaliteit op veel efficiëntere wijze te verwerken. We weten dat we op deze samenwerking kunnen bouwen, omdat ABBYY voortdurend met de bibliotheken en andere partners samenwerkt aan de verbetering van de kerntechnologie.”

“Door digitalisatie wordt het Europese intellectuele erfgoed niet alleen in standgehouden voor toekomstige generaties. Informatie wordt ook voor miljoenen onderzoekers, studenten en lezers in alle delen van de wereld ontsloten,” aldus Andrey Isaev, directeur SDK Products van ABBYY. “Het is een genoegen om een bijdrage te leveren aan dit waardevolle initiatief door innovatieve OCR-technologie te ontwikkelen en best practices uit te wisselen. We hebben bovendien grote waardering voor de hechte en productieve samenwerking met mensen die net zo enthousiast bezig zijn met tekstherkenning als wijzelf.”

De deelname van ABBYY aan het IMPACT-project volgt eerdere succesvolle Europese digitaliseringprojecten, zoals het METAe-project op. Speciaal voor dit laatste project ontwikkelde ABBYY de oplossing FineReader XIX dat in staat is om alle mogelijke lettertypen te herkennen. Eén daarvan is het historische lettertype Fraktur oftewel “zwarte letter”, wat voorkomt in gedrukte teksten uit de periode 1800 – 1938. ABBYY neemt deel aan het Digitisation-on-Demand-project, om miljoenen boeken te digitaliseren en in elektronische vorm beschikbaar te stellen. Daarnaast heeft het Duitse Fraunhofer Institute for Media Communication (IMK) de ABBYY FineReader SDK voor optische herkenning van historische lettertypes ingezet om het archief van het dagblad Neue Zürcher Zeitung succesvol te digitaliseren. De laatste verbeteringen van de herkenningstechnologieën van ABBYY zijn vanaf nu verkrijgbaar voor organisaties en instellingen in alle delen van de wereld. ABBYY FineReader Engine SDK en ABBYY Recognition Server 3.0 beschikken over een aantal recente verbeteringen die ABBYY heeft ontwikkeld voor herkenning van speciale teksten en documenten.

Raadpleeg voor meer informatie over het IMPACT-project http://www.impact-project.eu/.

Meer informatie over de OCR-technologie van ABBYY voor het herkennen van historische teksten is beschikbaar via http://www.frakturschrift.com .

Rate this post

Print Friendly