PDF/A, lo standard ISO che garantisce l'integrità dei documenti così come sono stati realizzati. Un PDF archiviabile, ricercabile che include anche email ed allegati.

Perchè non basta archiviare i PDF, i documenti di Office e registrare le email?

La sempre più frequente necessità di archiviare documenti elettronici e di permettere la loro riapertura nel tempo, con le conseguenti difficoltà a mantenere la compatibilità dei formati e la loro utilizzazione per fini di archiviazione a lungo termine, ci porta ad approfondire uno strumento utile ed unico in tal senso.

I riferimenti normativi dell’AgID

Di seguito i riferimenti dell’Agenzia per l’Italia Digitale con le regole tecniche in materia di formazione, trasmissione, copia, duplicazione, riproduzione e validazione temporale dei documenti informatici, nonché di formazione e conservazione dei documenti informatici delle pubbliche amministrazioni.

DPCM 13/11/2014
DPCM 13/11/2014 – Allegato 2 (formati dei files)

Trattasi di standard che chiaramente prevedono: il mantenimento dell’integrità del documento dal punto di vista visivo e dei contenuti stessi e un’archiviazione a lungo termine.

Ovviamente le applicazioni nel tempo si aggiornano o addirittura scompaiono, senza possibilità di continuare a funzionare sui più recenti sistemi operativi. Come si può preservare nel tempo tale necessità?

Le caratteristiche dei formati

Il formato PDF

Il formato PDF è uno dei formati standard di riferimento per la documentazione digitale; è una sorta di contenitore che può avere al suo interno: testo, immagini bitmap, grafica vettoriale, audio, e video. Includendo inoltre tutte le informazioni necessarie alla loro corretta visualizzazione, può essere gestito indipendentemente dall’hardware (computer, tablet, smartphone) e dal sistema operativo.

Essendo stato trasformato da Adobe in open source (libero da restrizioni legali), nel corso degli ultimi anni, sono state sviluppate numerose applicazioni per la sua gestione (creazione e lettura), molte delle quali gratuite.

Il PDF da solo non basta, in quanto la generazione o le impostazioni dei vari reader PDF possono mostrare i contenuti in modo diverso.

Tuttavia, per garantirne nel lungo termine la completa fruizione, l’integrità e la perfetta riproducibilità, nel corso della loro creazione dovranno essere utilizzate alcune accortezze. Sarà quindi indispensabile incorporare, al loro interno, alcuni elementi ed evitare di utilizzarne alcune caratteristiche.

Per semplificare queste operazioni è stato creato lo standard ISO internazionale PDF/A (Portable Document Format for Archive), appositamente sviluppato per l’archiviazione nel lungo periodo.

PDF/A è uno standard internazionale (ISO19005), sottoinsieme dello standard PDF, appositamente pensato per l’archiviazione nel lungo periodo di documenti elettronici a per creare, appunto, PDF/A; lo stesso garantisce che il documento sia visualizzabile sempre nello stesso modo, anche a distanza di tempo e con programmi software diversi.

Con il PDF/A converter, sarà quindi sufficiente rispettare questo standard per ottenere file PDF che riescano a superare indenni i cambi di tecnologia, le modifiche ai software e ai sistemi operativi, e rendere le modalità di archiviazione e la gestione dei dati a lungo termine.

Altra questione è rappresentata dall’archiviazione delle email standard, sempre più fonte di prova anche legale, che necessita di un “congelamento” dei contenuti stessi e degli eventuali allegati presenti, leggibili sia in formato nativo che in PDF.

Tutto questo ha portato allo sviluppo dello standard ISO PDF/A e – da parte di alcuni produttori – di software di applicazioni che implementano lo standard e semplificano la generazione del PDF/A.

Alcuni software di largo uso (Microsoft Office e OpenOffice), dal loro interno, già prevedono il salvataggio del singolo file nel formato di registrazione PDF/A non implementando tutte le versioni.

Il formato PDF/A

Profili e sottolivelli del PDF/A

 

Lo standard PDF/A è suddiviso in quattro profili:

  • PDF/A-1 definito dalla norma ISO 19005-1:2005, pubblicata il 1 ottobre 2005, basato sulla versione PDF 1.4 (Acrobat 5);
  • PDF/A-2 definito dalla norma ISO 19005-2:2011, pubblicata il 1 luglio 2011, basato sulla versione PDF 1.7 (ISO 32000-1:2008 – Acrobat 8);
  • PDF/A-3 definito dalla norma ISO 19005-3:2012, pubblicata il 15 ottobre 2012, basato sulla versione PDF 1.7 (ISO 32000-1:2008 – Acrobat 8);
  • PDF/A-4 definito nella norma ISO 19005-4:2020, pubblicata il 30 novembre 2020, basato sulla versione PDF 2.0 (ISO 32000-2:7-2017 – Acrobat DC).

Gli stessi sono, a loro volta, suddivisi in ulteriori sottolivelli di conformità.

L’aggiunta delle lettere “a” indica l’accessibilità (utenti con disabilità), “b” – di base (visivo) ed “u” – l’uso dei caratteri unicode.

 

Il livello di conformità “a” (PDF/A-1a) dovendo garantire anche l’accessibilità al contenuto dei documenti da parte degli utenti con disabilità, oltre ad avere gli stessi obblighi e restrizioni del livello “b”, dovrà anche contenere descrizioni alternative per le immagini e adeguate informazioni relative alla struttura logica e all’ordine di lettura del testo.

PDF/A-1a Standard ISO 19005-1:2005

PDF/A-1b Standard ISO 19005-1:2005

 

Il livello di conformità “b” (PDF/A-1b) garantisce che il documento mantenga nel tempo lo stesso aspetto visivo nel tempo.

Per ottenere questo, in fase di creazione occorrerà applicare i seguenti restrizioni e obblighi:

  • è vietata la protezione con password del documento;
  • non sono ammessi collegamenti a file esterni;
  • non è ammessa la compressione LZW o JPEG2000;
  • è vietata l’incorporazione di qualsiasi tipo di codice eseguibile;
  • tutti i font utilizzati all’interno del documento devono essere incorporati;
  • non sono ammessi oggetti e annotazioni nascoste;
  • è vietata la trasparenza;
  • è vietato l’utilizzo dei livelli;
  • i colori devono essere specificati in un formato indipendente dal sistema;
  • le immagini alternative (per esempio, a risoluzioni inferiori per la visualizzazione su monitor) non sono consentite;
  • sono consentiti i moduli ma con restrizioni;
  • il PDF non può avere al suo interno contenuti audio e video;

 

Le caratteristiche sono le stesse dello Standard PDF/A-1, ma sono ammesse queste eccezioni:

  • può contenere layer (per i livelli ottenuti con un programma CAD, o per avere, in un unico file, versioni in lingue diverse);
  • può contenere in un unico file diversi allegati, a condizione che anche essi siano conformi agli standard PDF/A-1 o PDF/A-2;
  • può contenere immagini compresse nel formato JPEG2000;
  • supporta le annotazioni;
  • supporta le firme elettroniche avanzate.

PDF/A-2a
Garantisce come lo standard PDF/A-1a la piena accessibilità al contenuto del documento.

PDF/A-2b
Garantisce come lo standard PDF/A-1b la sola conformità visiva.

PDF/A-2u
Non contiene, come invece il PDF/A-2a, le informazioni relative alla struttura del documento, ma -oltre a garantire che le pagine possano essere riprodotte visivamente in modo fedele, grazie al rispetto del sistema di codifica unicode indipendente dal sistema operativo, dalla lingua o dal programma utilizzato -, il testo può anche essere estratto e ricercato.

 

PDF/A-2 Standard ISO 19005-2:2011

PDF/A-3 Standard ISO 19005-3:2012

 

Anche per questo standard esistono, come per il PDF/A-2, tre sottolivelli: PDF/A-3a, PDF/A-3b e PDF/A3-u.

Mentre il PDF/A-2 consente solamente allegati conformi a PDF/A, il PDF/A-3 permette invece di allegare qualsiasi tipo di file (documenti di Word, tabelle di Excel, disegni tecnici, immagini digitali, database, file csv, xml, html …); ne permette la presenza e l’estrazione futura, ma non ne garantisce però l’apertura e la fruizione.

 

Si basa sul più recente formato PDF 2.0.

PDF/A-4 introduce indicazioni standard ISO per l’archiviazione di alcuni tipi di contenuti non statici comuni ai moduli PDF, come i campi dei moduli, il contenuto 3D e JavaScript. Questa nuova funzionalità tramite due soli livelli di conformità supporta la conservazione a lungo termine di dati dei moduli compilati, di documenti di tipo CAD (sostituendo di fatto il PDF/E) e mantiene intatte le caratteristiche di base PDF/A.

Abbandonando i precedenti livelli di conformità a/b/u, PDF/A-4 introduce due nuovi livelli di conformità:

  • PDF/A-4f consente gli allegati di file non-PDF/A (in modo simile PDF/A-3 estende PDF/A-2);
  • PDF/A-4e è rivolto alla comunità degli ingegneri: viene proposto come successore dello standard esistente PDF/E-1 ISO 24517-1, basato su PDF 1.6 ed aggiunge le annotazioni RichMedia per il contenuto 3D in formato U3D o PRC al formato base PDF/A-4.

In questo caso la lettera “f” indica files (inclusione di documenti non PDF), mentre la lettera “e” sta a sottolineare engineering (legato al mondo tecnico), che di fatto sostituisce la gestione dei documenti in formato PDF/E (ISO 24517-1:2008).

PDF/A-4 Standard ISO 19005-4:2020

La soluzione Callas per convertire i documenti in PDF/A.

Callas Software ha recentemente aggiornato la versione del suo software pdfaPilot alla versione 10. L’attuale versione del software permette di convertire i PDF anche nel nuovo  standard PDF/A-4.

Rimandiamo al link del software per le caratteristiche e funzionalità

Schedule time with me