PDF/A is zich langzaam maar zeker aan het manifesteren als de standaard voor het archiveren van documenten die langere tijd bewaard moeten worden. Hoe lang, lang is, staat daarbij nog open. Afhankelijk van de toepassing kan de tijd variëren tussen een maand of zolang Noord-Amerika een republiek is. Het is nog langzaam omdat PDF/A als standaard nog vrij nieuw is. Pas in het najaar van 2005 is PDF/A als officiële ISO standaard (ISO19005-1:2005) geannonceerd. In de korte tijd van zijn bestaan heeft het echter al een gerespecteerd aantal gebruikers gekregen. Is PDF/A daarmee de (toekomstige) standaard wat betreft document archivering en voor de document productieprocessen?

Achtergrond PDF/A

PDF/A is een afgeleide van de wijdverbreide PDF opmaak voor documenten. PDF staat voor “Portable Document Format” en is een ontwikkeling geweest van Adobe. In 1993 zag versie 1.0 het levenslicht. Adobe PDF versie 1.0 is gebaseerd op de PostScript taal, die veel gebruikt wordt voor het afdrukken van documenten op de lokale laserprinter.

Iedereen heeft tegenwoordig wel een (gratis) PDF Reader op zijn PC of MAC geïnstalleerd. Wat betreft de Reader van Adobe is dat versie 9. De Adobe Acrobat suite bevindt zich in versie 8. De huidige PDF standaard is nu in release 1.7. In de loop der jaren is er dus meer en meer functionaliteit toegevoegd aan de PDF standaard om te voldoen aan de technologische ontwikkelingen. Zo is er nu functionaliteit voor elektronische formulieren, video en flash, Unicode ondersteuning, het toevoegen van “tags” en de beveiliging en autorisatie opties zijn verbeterd. Een document opgemaakt in PDF versie 1.7 kan uiteraard niet gelezen worden met een Adobe Reader van vele jaren geleden. Zo geldt ook dat een PDF document opgemaakt in versie 1.0 niet altijd meer geopend kan worden met de Reader versie 9. Allemaal zaken die binnen archivering voor langere tijd niet wenselijk zijn.

Verschillen PDF en PDF/A

PDF/A en PDF zijn dan ook niet exact hetzelfde. PDF/A is een subset van de PDF standaard, speciaal ontwikkeld en gericht op het bewaren en toegankelijk houden, van een document dat over een langere periode bewaard moet worden. Ter promotie van de PDF/A standaard, dit jaar in Berlijn de 3e internationale PDF/A conferentie. Een conferentie met als doel de laatste stand van de ontwikkelingen, mogelijkheden en toepassingen te zien en te bespreken. De organisatie is in handen van het PDF/A Competence Center. Het PDF/A Competence Center is de organisatie die de PDF/A standaard verder ontwikkeld en promoot. Met meer dan 100 organisaties die op dit moment lid zijn al een gerespecteerde organisatie. Dat was ook te zien in het aantal deelnemers aan de conferentie, meer dan 200 internationale bezoekers, en het hoge aantal eindgebruikers daaronder.

Enkele belangrijke feiten wat betreft PDF en PDF/A

  • PDF is op dit moment een open “standaard”. Het is niet meer exclusief verbonden aan Adobe. De specificaties zijn voor iedereen beschikbaar en hebben geen licentiestructuur meer.
  • TIFF is geen open standaard die wordt beheerd door de ISO organisatie. TIFF kan worden veranderd door de software. Bijvoorbeeld annotaties kunnen door een bepaald software pakket worden aangebracht die daarna door een andere TIFF applicatie niet meer zijn te lezen of te gebruiken.
  • De PDF specificaties worden door een onafhankelijke organisatie beheerd en verder ontwikkeld.
  • PDF/A is een afgeleide (subset) van PDF versie 1.4. Dus niet alle mogelijkheden die in de latere PDF versies zijn toegevoegd kunnen worden geconverteerd naar PDF/A.
  • PDF/A kent twee niveaus van “compliance”;
    • PDF/A-1a is het hoogste niveau. Het is niet eenvoudig te bereiken, maar garandeert wel een toekomstige representeerbaarheid die exact gelijk is aan het origineel. Waarbij de structuur van het document is vastgelegd en de semantische structuur correct is. Het laatste is vooral belangrijk wanneer het document is opgedeeld in kolommen.
    • PDF/A-1b garandeert alleen de visuele representeerbaarheid. De structuur kan daarbij verloren gegaan. Wanneer de structuur van bijvoorbeeld de kolommen niet duidelijk is voor elektronische verwerking, kan dit problemen geven bij OCR herkenning, of het representeren van het document via audio-visuele hulpmiddelen.
  • PDF/A is een officiële ISO standaard. Dit waarborgt toekomstige ontwikkelingen en beschikbaarheid van de beschrijving van de standaard. Een document opgemaakt in PDF/A-1a zal dan ook altijd leesbaar blijven voor welke toekomstige release van de PDF/A standaard dan ook.
  • In Microsoft Office 2007 kan een Microsoft add-in worden geïnstalleerd die het mogelijk maakt om het document te bewaren in PDF en als optie in PDF/A formaat. (Dus geen noodzaak meer om een printer-driver te installeren!)

Is PDF/A de oplossing voor electronische archivering?

Is PDF/A nu de oplossing voor het voor langere tijd archiveren van elektronische documenten? Helaas is het antwoord nog niet volledig ja. Zowel op het technische vlak, maar ook op het functionele vlak zitten er nog wel wat ‘haken en ogen’ aan het gaan archiveren volgens de PDF/A standaard.

Een van de grotere struikelblokken van de PDF/A standaard is dat in elk PDF/A document alle ‘resources’ zijn opgeslagen die het weer mogelijk maken om het document exact zo weer te geven als opgemaakt. Dat betekent vooral dat de fonts in het document zelf bewaard worden. Dit lijkt in eerste instantie niet zo erg, totdat het om vele miljoenen documenten gaat. Dan gaat de teller in Terabytes opslag aardig doorlopen. Het opslaan van enkele fonts in het document kan al snel een 20KB extra opslag tot gevolg hebben.

Wanneer voldaan moet worden aan de stringentere PDF/A-1a criteria betekend het zelfs dat in elk document de volledige Unicode tabellen worden meegenomen. Een andere technische beperking is het gebruik van beelden die in JPEG2000 formaat zijn bewaard. JPEG2000 wordt niet ondersteund binnen PDF versie 1.4 en daarmee ook niet binnen de daarvan afgeleide PDF/A standaard. Op functioneel gebied zijn er ook nog enkele onderwerpen die verder uitgewerkt moeten worden. De software voor het aanmaken van een PDF/A document moet uiteraard voldoen aan de standaard. Maar wie garandeert u dat de software die de conversie doet wel aan de standaard voldoet en dus een officieel PDF/A document oplevert? Een ander moeilijk punt is de PDF documenten met digitale handtekening. Na conversie van een PDF document naar PDF/A document is in principe de digitale handtekening niet meer geldig. Moet nu elk document dan maar weer digitaal ondertekend worden?

Kiezen voor PDF/A?

Wat nu te doen, wel of niet overgaan op PDF/A als standaard voor archivering? Het antwoord daarop is niet simpel te geven en hangt van een aantal factoren af. Wat is de oorsprong van de documenten, hoelang moeten de documenten bewaard worden, wat zijn de wettelijke bepalingen, waarvoor doen we het en wie zijn de gebruikers? PDF/A kent op dit moment al een grote groep gebruikers. Zo zijn er al vele nationale of regionale archieven overgegaan op de PDF/A standaard. Ook binnen verzekeringorganisaties is het gaan gebruiken van PDF/A als standaard aangeslagen. PDF/A als de standaard voor langere tijd archivering van bedrijfskritische documenten heeft de eerste plaats wel verworven.

Alles in PDF/A archiveren is echter nog niet aan te raden. Enerzijds omdat het gewoonweg nog niet kan, anderzijds omdat het gewoonweg niet handig is. AFP printer data streams kunnen het beste nog als AFP data stream worden gearchiveerd. PDF documenten die de laatste functionaliteiten gebruiken van versie 1.7 van de PDF standaard, kunnen op dit moment nog niet geconverteerd worden naar PDF/A. Dan is het beter even te wachten op de volgende versie van de PDF/A-2 standaard die eind 2010 verwacht wordt.

PDF/A als formaat voor documenten in het productieproces is dan ook eigenlijk nog geen optie. Enerzijds klinkt het aantrekkelijk om met een echt onafhankelijk formaat de documentopmaak en productieprocessen aan te sturen, anderzijds is het formaat nog niet echt handig om in hoog-volume documenten te verwerken, af te drukken en te archiveren.

PDF/A is zondermeer de standaard voor archivering van elektronisch opgemaakte documenten en voor gescande documenten. Al vele leveranciers hebben producten ontwikkeld die de conversie kunnen doen van een origineel formaat naar PDF/A. Er zijn producten die een PDF/A document kunnen valideren of het wel een echt PDF/A document is en de huidige Readers zijn in staat om te laten zien of het geopende document een PDF/A document is. Het overgaan op PDF/A als standaard in plaats van TIFF is aan te raden. Al moet wel eerst het nodige huiswerk als voorbereiding worden gedaan.


Rate this post

Print Friendly