Prof. Sabine Süsstrunk

Groupe image et représentation visuelle, Faculté Informatique et Communication, EPFL

 Retour au programme de le rencontre

Le prof. Sabine Süsstrunk rappelle qu’il y a beaucoup d’exemples du numérique au secours du patrimoine. On a pu voir que la pellicule film a une durée de vie limitée. En photo couleur le cyan tend à disparaître, et les responsables de la conservation traquent le « syndrome du vinaigre ». Ils savent que les documents doivent être conservés dans des conditions bien précises, loin de toute influence chimique. Il faudrait même éviter tout accès à ces documents. Idéalement il ne faudrait pas toucher ces objets, donc interdire toute consultation. Ce n’est pas une solution.  

 

Le code numériquedscn4207

Quel est l’avantage du code numérique pour l’information patrimoniale ?

  • C’est un code universel,
  • Il est très précis,
  • C’est le code natif de l’ordinateur (des zéros et des uns), facile à traiter,
  • Il est déjà ancien et bien connu (depuis 1936),
  • Il peut être copié sans perte.

La théorie de l’information de Shannon montre qu’on peut générer des corrections, permettant de garantir l’intégrité des données. Et il y a des moyens de cryptage. Le code peut être envoyé partout dans le monde sans support matériel.

 

Travailler sur les images

Exemple des images : en informatique ce sont des chiffres. On peut donc faire de la mathématique là-dessus. Lorsqu’il s’agit de reconstituer une peinture, comme il n’est pas question d’intervenir physiquement sur Mona Lisa, on peut faire des captures avec une analyse multispectrale, et ainsi reconstruire la peinture telle qu’elle était à l’origine, au temps de Léonard de Vinci, avec un ciel à base de lapis-lazuli.

De même pour les bâtiments, les images multiples permettent de retrouver l’allure d’origine.

Pour les textes, la reconnaissance de caractères est bien au point. Si on a affaire à un texte ancien, difficile à lire, une méthode basée sur le « Captcha » qui sert à identifier un utilisateur humain permet, par la lecture d’une deuxième image de mot extraite d’un tel texte (« Recaptcha »), de faire appel à des millions de gens pour contribuer à la lecture correcte de ce texte.

Pour la recherche et la récupération de l’information les méthodes sont bien connues. Dans le cas de fragments d’images (exemples : fragments des manuscrits de la Mer Morte) on peut assembler les fragments pour reconstituer le tout.

S. Süsstrunk cite un exemple de travail d’étudiants où on a modélisé en 3D les statues de Lausanne. Une multitude de photographies a permis de reconstituer la forme sur laquelle on pu ensuite coller la texture originale, avec le soutien de la société Pix4D (voir : http://actu.epfl.ch/news/les-statues-lausannoises-capturees-en-3d/). Un autre travail a porté sur une vue en trois dimensions de Lausanne.

Il ne faut pas oublier qu’on fait toutes les deux minutes davantage de phootographies que toute l’humanité pendant le 19e siècle. Chaque minute 48 heures de vidéo sont téléchargées sur Youtube… Cela donne des archives immenses. Le nombre d’images sur Facebook, Flickr, Youtube est sans commune mesure avec ce qui est géré par la Library of Congress. C’est une opportunité et un avantage pour la pérennité des données.

 

Pérennité

Il faut parler encore des questions de pérennité. S. Süsstrunk cite James M. Reilly, de l’Image Permanence Institute de Rochester. Le code fait de 0 et de 1 doit être interprété. Si je n’ai pas la structure me permettant de traduire ce code, ça pose des problèmes. L’enregistrement des données est optimisé pour les ordinateurs d’aujourd’hui – et de demain. Qui sait encore lire les floppy disks à 1,4 MB. ?

On apprécie le stockage le moins encombrant possible

Le stockage : on ne sait pas où est enregistré le code correspondant à notre information. Le code est numérique, mais les données sont analogiques, et il faut être capable de les relire, en tenant compte de l’architecture de l’ordinateur, avec le mécanisme de correction d’erreur, etc. Le support est fragile. La permanence numérique est-elle possible ? Oui, il faut copier, copier, copier… ce serait en fait cela le Saint Graal !

Si on ne fait rien, il faudra développer des études en archéologie numérique. On peut faire le musée des ordinateurs (tel le Bolo Museum), garder les machines, mais on ne peut garder les techniciens. On a quelques expériences avec l’émulation : c’est compliqué, cher, ça ne marche pas.

Il faut garder le code numérique. Mais une migration correcte n’est pas facile. Mais cela induit un coût récurrent : chaque année, il y a un coût. La conservation analogique ne coûte pas beaucoup, mais pour les données numériques c’est beaucoup plus cher. C’est en fait une décision politique. Une possibilité pourrait être d’externaliser les données, sur le Cloud. La question est : qui contrôle le cloud ? Si Microsoft fait faillite (comme cela est arrivé à Kodak). Et cela coûte aussi, pas pour les privés mais pour les archives.

Une possibilité serait de recourir au microfilm, durant quelques centaines d’années, sur lequel on met le code numérique, que l’on peut re-scanner, et de mettre aussi en texte l’explication du code. L’Université de Bâle a utilisé cela.

En résumé, le code numérique a beaucoup d’avantages, mais sa survie à long terme n’est pas garantie. Et ce n’est pas une priorité, ni pour la recherche, ni pour l’industrie. Théoriquement on a résolu le problème, mais c’est pratiquement qu’on ne l’a pas résolu.

(Résumé J.-F. Cosandier)

 

Retour au programme de le rencontre