Sulla preservazione dei dati

Mele e appunti

Questo articolo trova la sua genesi da una serie di input disordinati raccolti di recente. Non sto a elencarli tutti in dettaglio, ma ne riassumerò alcuni.

1. Un paio di giorni fa mi sono riletto questo vecchio articolo di Mark Pilgrim, del giugno 2006. Nel luglio 2007 menzionai questo articolo in un mio breve post. Riporto nuovamente il passaggio che contestualizzava il riferimento:

Per chi non frequenta il sito/weblog di Pilgrim, occorre spiegare come il nostro stia portando avanti una campagna personale volta all’utilizzo sempre più esclusivo di sistemi e soluzioni open source. Pilgrim ha più volte criticato Apple in quanto, nel suo (più o meno) piccolo, anche Apple implementa soluzioni proprietarie che “obbligano” l’utente Mac a rimanere “legato” ad Apple per la conservazione dei propri dati.

Ricordo di aver letto quanto scritto da Pilgrim con un filo di sufficienza, soprattutto quando dice Ora sto creando cose che voglio essere in grado di leggere, ascoltare, guardare, cercare e filtrare da qui a 50 anni. Ricordo di aver pensato ‘Auguri vivissimi’. Non perché ritengo che il suo sia un proposito sciocco o velleitario, semplicemente perché ritengo che sia un proposito difficilmente attuabile, non importa in che misura uno abbracci l’open source. Su questo ritorno più avanti.

2. Nel mio studio ho ancora in mostra una bella cartolina che presi a Milano nel 2004 quando visitai l’esposizione che celebrava i 50 anni dell’Alfa Romeo “Giulietta”. Tempo fa, quando mi occupai di effettuare un backup accurato di tutte le foto digitali che ho scattato dal 2002 in poi, notai una ‘falla temporale’ nel periodo maggio-luglio 2004, e infatti non riuscivo a trovare da nessuna parte le foto che avevo scattato all’esposizione sulla Giulietta. Un peccato, perché fotografai parecchie automobili Alfa Romeo storiche, e sono un po’ un patito di auto d’epoca. Dopo molto cercare fra CD di backup parziali e provvisori, mi sono ricordato che in quel periodo il disco rigido del mio PowerBook si guastò. Riuscii a ricuperare informazioni importanti (personali e di lavoro), ma evidentemente un folto gruppo di foto digitali scattate nell’arco di tre mesi erano andate perdute senza rimedio. Ho pensato ai rullini di foto che mio padre scattò alle prove del Gran Premio di Monza del 1978: lui possiede ancora i negativi, ben conservati in un’apposita valigetta. Quelle foto, scattate 31 anni fa, sono ristampabili e nuovamente scansionabili oggi. Sono rimaste assolutamente accessibili come lo erano il giorno dopo lo sviluppo.

3. Oggi leggo un commento sul blog di Lucio, rilevante (per me) il punto in cui ‘mAx’ dice: Chiediamo ad un utente WIN se è riuscito a conservare e riesce a visionare i file creati 9 anni fa sul suo attuale PC??.

Come accennavo all’inizio, gli input sono molti di più (ultimissimo in ordine cronologico: una serie di file di sottotitoli con estensione .srt perfettamente leggibili da VLC su Mac ma non da VLC su Windows Vista), ma gli ingredienti della mia riflessione sono sostanzialmente contenuti nei tre punti qui elencati. Partirò dall’ultimo.

Non vi è mai stato un periodo nella mia vita informatica in cui ho utilizzato esclusivamente Windows, ma negli anni più prolifici della mia scrittura creativa l’unico sistema completo (computer più stampante laser) che avevo in casa era un PC, un IBM compatibile con processore Intel 80386DX a 40 MHz. La stampante, un’ottima HP LaserJet 4L. Il sistema, acquistato 15–16 anni fa, era costato circa 3 milioni e mezzo di Lire. Evidente, quindi, che fosse nelle mie intenzioni farlo durare il più a lungo possibile.

Da ‘ex-utente Windows’ posso rispondere a mAx e dire: sì, sono riuscito a conservare e ad accedere a file creati non 9, ma almeno 15 anni fa. I file — incredibile dictu — risiedono tuttora su più di 300 floppy disk gelosamente conservati e protetti in tutto questo tempo. Non ho utilizzato un computer attualissimo per accedervi, lo ammetto, ho dovuto ricorrere a un PC portatile con qualche anno sulle spalle (e soprattutto ancora dotato di un lettore floppy), ma posso dire che file creati in Word 2.0 sotto Windows 3.1 sono stati aperti e letti da Word 2003 sotto Windows XP Professional. Nessuna perdita di dati o formattazioni, se si esclude la mancanza di certi font usati nel 1993 (problema risolvibile installando quei font sul PC più moderno — li ho ancora tutti, conservati in una quarantina di floppy).

È però una cosiddetta vittoria di Pirro. Nel 1993–1995 creai moltissimo materiale (piccole raccolte di poesie, progetti per libri altrui, materiale pubblicitario, opuscoli, guide, ecc.) utilizzando Microsoft Publisher 2.0 per Windows 3.1. (Sì, vi vedo sorridere. Mi sono fatto le ossa su Publisher, sono arrivato a conoscere quel programma come il palmo della mia mano, ho appreso i primi rudimenti di book designing con quel sistema e quel software, e non me ne vergogno. Publisher 2.0 e Word 2.0, a quell’epoca e su quella piattaforma, erano ottimi programmi, robusti e stabili. Nella mia esperienza, Word 2003, Word 2007, sono andati in crash in un pomeriggio più volte che Word 2.0 in cinque anni).

Ora l’esistenza di quel materiale è appesa a un filo. Il formato Microsoft Publisher è proprietario e, che io sappia, non esiste un software in grado di aprire un file .pub in modo trasparente. Per accedere a quei file e a quei lavori devo utilizzare una certa combinazione di hardware e software, più moderni ma ancora ‘retrocompatibili’, e da lì tentare un’esportazione verso formati più accessibili e duraturi, anche se dopo alcune prove è chiaro come sia più semplice conservare i contenuti che non la forma e le formattazioni — che per un progetto librario, un opuscolo, una guida, non ha completamente senso.

Il primo passo per mettersi sulla buona strada verso la preservazione dei propri dati è cercare di essere il più lungimiranti possibile all’atto stesso della creazione di quei dati. Mai pensare al presente soltanto, mai pensare Adesso creo. Di tutto il resto mi occuperò in un secondo momento. Per non perdere tutto il materiale da me creato nel 1993–1995 con quella workstation PC oggi sono costretto a mantenere una analoga workstation che supporti le tecnologie hardware vigenti in quegli anni (lettore di floppy, porta parallela per collegare la stampante HP — sì, sempre quella, ancora funzionante), e dei software che mi permettano di leggere tali informazioni. E non è tutto: per ‘tramandare’ quei dati e fare in modo che siano ancora accessibili fra 5–10 anni, è necessario che l’hardware sia sufficientemente moderno per esportare i dati in altri formati o per scriverli su altri supporti (CD e DVD, per esempio). Altrimenti tutti quei dati saranno presto illeggibili.

Quando producevo quei lavori, ancora reduce della spesa per il PC prima e per la stampante laser poi, ragionavo in modo miope: siccome quella workstation ‘doveva durare’, mentre creavo quel materiale non mi preoccupavo della sua accessibilità di lì a pochi anni. Una parte di me dava per scontato che avrei sempre trovato un modo per cavarmela, e tiravo avanti. Ma è bastato cercare di passare quei file su piattaforma Mac nel 1996 per scontrarmi con problemi di incompatibilità e di illeggibilità.

Oggi avverto le preoccupazioni di Mark Pilgrim in maniera più acuta. Rispetto al 1993, l’informatica ha fatto passi in avanti inconcepibili, eppure la persistenza dei dati e la loro potenziale volatilità rimangono un problema. Negli anni ’80 e ’90 una fonte magnetica poteva cancellare floppy e nastri e tutto era perduto. Oggi si salta un backup e/o si guasta un disco rigido e la situazione può essere ugualmente disperata. Il problema dell’accessibilità dei dati (e quindi della loro preservazione) abbraccia più livelli. Devono essere copiati su supporti sempre attuali o quantomeno leggibili da dispositivi con un minimo di compatibilità all’indietro. Devono essere duplicati per sicurezza su più supporti. Devono essere in formati il più possibile ‘aperti’ e comprensibili dalle applicazioni oggi in uso. O meglio: possibilmente dalle applicazioni in uso domani. Per non parlare della compatibilità fra piattaforme differenti.

Non si tratta di giocare agli indovini ma, come dicevo, di cercare di evitare il rischio miopia. Io mi sono sempre occupato di testi, e questa è stata una fortuna, in retrospettiva. Il testo puro, non formattato, è leggibile da un centinaio di applicazioni di qualsiasi epoca e piattaforma. In altri ambiti — audio, video, grafica, DTP — le insidie aumentano. Con applicazioni che registrano file in formati proprietari, le insidie aumentano, e quel che può essere normale amministrazione oggi diventa quasi sicuramente un bel grattacapo domani.

Quando dicevo all’inizio che l’approccio di Pilgrim nel rivolgersi all’open source è lodevole ma non sufficiente a garantire la leggibilità dei suoi dati da qui a 50 anni, non intendevo sottovalutare l’open source (è grazie a progetti open source che si riesce, come nel caso dello scanner di Lucio, a interfacciare tecnologie datate con strumenti attuali). Intendevo semplicemente far notare come le variabili in gioco siano comunque molte. Esempio: supponiamo di avere una serie di file .qxd creati da QuarkXPress 3.3 su un Macintosh con System 7.1 nel 1995 e registrati su un disco magneto-ottico. Per poter leggere quei file nel 2009 da un Macintosh con processore Intel e con l’ultima versione di Mac OS X è necessario avere un lettore compatibile con il supporto in cui sono stati archiviati; una versione del programma che ha generato i file abbastanza moderna da girare sui Mac di oggi e che abbia la capacità di leggere i file creati da una versione così datata dello stesso programma; oppure un’altra applicazione in grado di interpretare quei file in maniera sufficientemente affidabile. Magari si possiede il dispositivo per leggere fisicamente i dati, ma non il programma per interpretarli. O viceversa. Questo per limitarmi alla punta dell’iceberg.

Ammetto che l’esempio di prima possa essere una situazione-limite, ma non è del tutto improbabile. Gli utenti come me e voi che mi leggete ormai ben conoscono un altro caposaldo per una migrazione e conservazione (abbastanza) efficiente dei dati: il backup e la loro copia continua su supporti sempre attuali, la ridondanza dei luoghi e possibilmente dei formati dei dati (di quella fattura fatta in Pages o Numbers, meglio avere anche una copia in PDF, sai mai). Ma quando mi capitano in mano i negativi fotografici, miei e quelli di mio padre o mio nonno; quando sfoglio libri antichi, oppure solo racconti da me dattiloscritti una ventina d’anni fa, mi vien da pensare a una cosa di cui ho già parlato qui tempo addietro. Penso che un bel traguardo tecnologico nella preservazione dei dati sarebbe la creazione di un supporto duraturo che non ci costringa a fare i ‘data-sitter’, che non ci obblighi alla costante manutenzione delle informazioni create. Che elimini (almeno in parte) la costante preoccupazione per la salvaguardia e la compatibilità di file e informazioni.

Ovviamente non sarebbe una panacea e risolverebbe il lato hardware della questione. Il lato software rimarrebbe un ostacolo interessante. È forse anche per questo che sono vent’anni che la metafora dell’interfaccia dei sistemi operativi è ferma alla ‘scrivania’, ai ‘file’ e ‘cartelle’, e così via? La ‘paura del nuovo’ in quest’ambito è forse quella di creare una metafora così innovativa da tagliare irrimediabilmente i ponti con il passato, lasciando i vecchi archivi sull’altra sponda del guado? Ma è un’altra storia, che affronterò presto in questa sede.

The Author

Writer. Translator. Mac consultant. Enthusiast photographer. • If you like what I write, please consider supporting my writing by purchasing my short stories, Minigrooves or by making a donation. Thank you!

4 Comments

Comments are closed.