Chacun y va de son anecdote. Peterv raconte cette histoire folle, où le gouvernement britannique a numérisé en 1986 un ouvrage datant de 1086 (oui, 900 ans plus tôt), le fameux Domesday book. Seulement voilà, en utilisant la haute technologie de l'époque pour numériser l'ouvrage et l'archiver pour les génération futures, il devient quasiment impossible de l'utiliser seulement 15 ans plus tard, car il nécessite des lecteurs et des ordinateurs spécifiques. Comme le signale un expert qui travaillait sur le sujet : Il est paradoxal que la version récente soit inutilisable, alors que l'ancienne est toujours accessible. On a de la chance que Shakespeare n'ait pas utilisé un vieux PC pour écrire son oeuvre
.
Le père de Peterv renchérit : dans son secteur, il y a eu une bataille entre deux sociétés pour le marché des SIG, des logiciels qui permettent de représenter des données sur des cartes. Les deux systèmes (incompatibles) ont été utilisés pour produire de grandes quantités de données. La bataille terminée, il y a eu un vainqueur et un vaincu, et le vainqueur a maintenant le monopole du marché. Mais les anciennes données générées avec le produit concurrent ne sont pas lisibles avec la solution du seul acteur restant. C'est dramatique, car il est essentiel de pouvoir analyser l'évolution des données au cours du temps. Dans le cas de l'eau (le métier du père de Peterv), c'est vital. Telle ou telle zone est-elle inondable ? Peut-on construire à cet endroit ? Les nappes phréatiques sont-elles en train de se vider au cours du temps, et doit-on mettre en place une solution pour préserver la vie à cet endroit ?
J'enfonce alors le clou en racontant l'histoire des données des missions Apollo et des premiers lancements des navettes spatiales, dont la Nasa, plusieurs années après, à toujours besoin. Mais les bandes magnétiques sont devenues illisible. On a du se tourner vers une version papier, un classeur de 800 pages, qui aurait été retrouvée dans le garage d'un des scientifiques qui avait à l'époque travaillé sur ces projets.
Combien d'entre nous ont encore des données stockées sur des disquette 5"1/4, 3"1/2, voire d'autres supports plus exotiques encore ? Combien de millions de documents stockés au format WordPerfect ? Combien de milliards d'enregistrements de bases de données dans des formats propriétaires et non-documentés ? Sommes-nous prêts à dépenser des fortunes pour les récuperer, ou avons prévu de les laisser devenir obsolètes ? Il est plus probable que nous n'avons rien prévu du tout... Au delà de la problématique du support physique, reste celle du format des données. L'unique solution repose sur la combinaison des standards ouverts et du logiciel Libre, qui garantissent que les spécifications du format sont publiques et que chacun dispose du contrôle sur logiciel qui permet d'accéder au données, indépendemment du business plan d'une entreprise (quelle qu'elle soit), qui a pour principal objectif, non pas de garantir la perennité de vos données, mais de vous faire migrer vers la nouvelle version, seule façon de garantir sa croissance et donc, sa survie.
A l'heure du tout-Internet, du tout numérique (même les photos, les musiques), d'un progrès toujours plus galopant, n'oublions pas notre culture, et sa pérénnité. N'oublions pas que le logiciel libre et les standards numériques sont les seuls garants de notre accès à notre culture sur le long terme. A ce propos, qui peut me garantir que je pourrais, dans 20 ans, lire un CD protégé comme celui de Ben Harper dans ma future chaine Hifi, alors que je n'arrive déjà pas à le lire dans mon autoradio ? Qui me dit que vous arriverez à lire les enregistrements des gazou-gazou de votre petit dernier au format Windows Media ? On en a déjà transpiré pour convertir des films du Super-8 au format VHS, mais qu'en sera-t-il quand il s'agira de formats numériques 1000 fois plus complexes, alors que la récupération de cassettes Betamax est devenue mission impossible ?
Alors je sais, je me répète : standards ouverts et logiciels Libres sont les gages de la pérennité, l'enjeu étant la culture, on peut considérer qu'il est de taille.
4 réactions
1 De Emmanuel - 20/11/2003, 16:38
"Cimetières numériques" — au titre je pensais que tu parlais de ces décharges polluantes d'ordinateurs soi-disant périmés ou obsolètes que l'on envoie pour recyclage dans des pays peu développés et qui atteignent à la santé d'individus, d'enfants, sans parler du déversemment de produits nocifs dans l'environnement... Mais non, ce n'est pas de cela dont tu parles, ouf ça me rassure
Pour Noël, offrez-donc votre "vieil" ordinateur à une association s'occupant de reconversion de matériel pour des consomateurs ayant moins de moyens. Installez donc une distribution Linux avec OpenOffice.org et autre Gimp dessus tant que vous y êtes, vous ferez des heureux.
2 De s t e f - 21/11/2003, 09:50
Mmmmh.
Ça me rappelle un album de BD que j'ai beaucoup aimé, "Demain les Dauphins", de Miguelanxo Prado.
Dans cette histoire assez proche dans l'esprit de "Demain les chiens", le classique de Clifford D. Simak qu'on a tous lu au collège, on voit les humains décliner après avoir modifié génétiquement les singes pour en faire des esclaves modernes. Les mammifères dominants au niveau de l'intelligence finissent par être les dauphins, dont les nageoires redeviennent des membres préhensiles une fois qu'ils ont développé une science suffisamment poussée pour porter sur leur dos des packs qui leur permettent de s'affanchir de nager.
Je me rappelle d'une scène particulièrement frappante, vers la fin de l'album. Quelques dauphins et un singe discutent de petits cubes que les humains ont laissés, mais qu'on ne peut ni ouvrir, ni lire. On soupçonne que les humains ont stocké tout leur savoir là-dedans, mais c'est inaccessible.
Pourtant le format des cubes, pour revenir à ton discours, est standardisé.
Tout ça pour dire que ce n'est pas forcément les standards et l'open-source qui provoqueront de facto la pérennité des données à long terme. Je ne dis pas que ça n'aidera pas, mais quant à croire que c'est nécessaire et suffisant...
3 De GoldoRaf - 21/11/2003, 16:55
C'est un sujet effectivement de plus en plus pris au sérieux par les scientifiques. Tu cites le cas d'Apollo et de la navette spatiale, mais c'est oublier que la NASA a carrément perdu 40% des données transmises par les sondes martiennes Viking, par la faute de bandes magnétiques tombées en poussière ! Les sondes interplanétaires renvoient de telles quantités de données qu'il faut des décennies aux scientifiques pour les analyser entièrement (si on a le budget pour le faire, contrairement au cas de Viking), la seule solution est donc de stocker, mais encore faut il pouvoir préserver ces données. Qui plus est, si en 10 ans la capacité de stockage des mémoires de masse a été en gros multipliée par 100, la capacité de transfert de données d'un support à un autre n'a été multipliée que par 10 ! Autrement dit selon certains, on s'approche du stade où il faudra plus de temps pour transférer des données sur un nouveau support que la durée de vie du nouveau support ! (bon on y est pas encore mais ça en prend le chemin).
4 De Solog! - 27/11/2003, 17:07
La publication sur Internet
La publication sur Internet, ça passe par un nombre impressionnant de choses : le moyen de publications (listes de diffusion, site ouèb...), la langue, l'étendue de la diffusion, etc. Si tant de facteurs rentrent en compte lors de l'édition d'un docum...