2xRien - un blog

Blog personnel d'Adrien Foucart. Toutes les opinions présentées ici n'engagent que moi. Blog garanti sans pub, sans traqueurs, et 100% rédigé par un humain.

Comment déchiffrer un vieux manuscrit calciné

Adrien Foucart, 20 Oct 2023 [Lien permanent]

Ceci est un rouleau de papyrus:

Le premier rouleau

Il a vĂ©cu des jours meilleurs. Il faut dire qu’il a Ă©tĂ© dĂ©terrĂ© au dix-huitiĂšme siĂšcle, 1700 ans aprĂšs avoir Ă©tĂ© recouvert de cendres et de dĂ©bris, et complĂštement carbonisĂ©, lors de l’éruption du VĂ©suve. Avant ça, il se trouvait dans une belle villa d’Herculaneum, bien installĂ© dans une bibliothĂšque avec plusieurs centaines de ses camarades. Les historiens aimeraient beaucoup pouvoir lire ce qu’il y a dans ce papyrus, et dans les centaines d’autres rĂ©cupĂ©rĂ©s dans la villa. Mais comment faire pour lire un manuscrit carbonisĂ© et impossible Ă  dĂ©rouler sans complĂštement le dĂ©truire ?

C’est Ă  cela que s’attaquent celles et ceux qui participent au “Vesuvius Challenge”, et c’est pas de la tarte ! Mais les premiĂšres lettres ont rĂ©cemment Ă©tĂ© dĂ©chiffrĂ©es, ce qui laisse Ă  espĂ©rer qu’une solution plus ou moins complĂšte est au moins possible. Pour arriver Ă  faire ça, les rouleaux ont Ă©tĂ© imagĂ©s avec un CT scan Ă  haute rĂ©solution (8”m par pixel), ce qui permet de “voir” Ă  l’intĂ©rieur. Plus ou moins – c’est un peu plus compliquĂ© que ça.

Il y a trois étapes principales pour résoudre le problÚme:

  1. DĂ©rouler virtuellement le manuscrit pour retrouver des fragments plus ou moins intacts
  2. Retrouver sur ces fragments dĂ©roulĂ©s des traces d’encre
  3. Lire

DĂ©rouler virtuellement le manuscrit

Une coupe transversale du rouleau ressemble à ça (toutes les images proviennent de scrollprize.org):

Coupe CT du premier rouleau

Si vous voulez voyager à travers les coupes, il y a une vidéo de 8 minutes qui traverse tout le rouleau: https://www.youtube.com/watch?v=cY5BIxkf5m0&t=33s.

On peut assez clairement voir les diffĂ©rentes “couches” du rouleau. Mais pour les “dĂ©rouler”, il ne suffit pas de “clairement” voir, il faut faire voir Ă  la machine. Ce qui signifie, pour l’instant en tout cas, de manuellement venir annoter les images pour “suivre” le trajet du parchemin, Ă  travers les couches, jusqu’à ce qu’on ait un fragment de taille raisonnable pour lequel on est sĂ»r d’avoir bien identifiĂ© le papyrus. On peut ensuite simuler le “dĂ©roulement” de ce fragment pour obtenir un volume aplati. Ici, on voit ce que ça donne:

Coupe aplatie, qui reprend les voxels annotĂ©s avec une marge de ~0.25mm (32 voxels) de part et d’autre de la surface

On y voit assez facilement la texture des fibres du papyrus. Par contre, pour lire, c’est un peu plus compliquĂ©.

Retrouver des traces d’encre

Une technique similaire avait Ă©tĂ© utilisĂ©e pour dĂ©chiffrer certains manuscrits de la mer morte. Mais pour ces manuscrits, l’encre utilisĂ©e avait des composants mĂ©talliques, qui la rendait fort visible au CT. L’encre utilisĂ©e Ă  Herculaneum, malheureusement, n’a pas cette propriĂ©tĂ©: elle est invisible aux rayons X.

Ou plutĂŽt, presque invisible.

Fragment d’environ 6mm de cĂŽtĂ© avec des rĂ©sidus d’encre, Casey Handmer

Casey Handmer, un participant du concours, a gagné $10.000 grùce à cette découverte: vous voyez ces petites craquelures sur le papyrus ? Non ?

Fragment annoté, Casey Handmer

Et lĂ  ? Les craquelures sont, probablement, des rĂ©sidus d’encre. Ils forment ici la lettre pi: le manuscrit est en grec.

Luke Farritor et Youssef Nader ont ensuite indĂ©pendamment entraĂźnĂ© des modĂšles de machine learning Ă  reconnaĂźtre ces rĂ©sidus d’encre, afin de gĂ©nĂ©rer des images ‘amĂ©liorĂ©es’, oĂč les lettres deviennent visible Ă  l’oeil nu. En tout cas: plus visibles.

Le mot Ă  $40.000: Î ÎŸÎĄÎŠÎ„ÎĄÎ‘Ïč

Une fois le premier mot trouvĂ©, les choses s’accĂ©lĂšrent, les modĂšles s’amĂ©liorent, et les images aussi:

Fragments reconstruits

ProblÚme résolu?

Y a plus qu’à


On sait maintenant qu’il est possible de dĂ©rouler virtuellement le manuscrit
 en tout cas certains morceaux.

On sait qu’il est possible d’y trouver des rĂ©sidus d’encre, et de les mettre en avant.

Mais le boulot reste consĂ©quent. Pour l’instant, la “segmentation” des fragments de manuscrit (c’est-Ă -dire: sĂ©parer les couches du rouleau et en faire des morceaux de taille suffisante pour en tirer potentiellement du texte) est en bonne partie manuelle, et donc lente. Des outils pour accĂ©lĂ©rer et partiellement automatiser le processus sont en train d’ĂȘtre construits, avec plus ou moins de succĂšs. Et en identifiant et dĂ©roulant les fragments, il faut Ă©videmment faire attention Ă  prendre note de sa position dans le rouleau initial, le but Ă©tant in fine de pouvoir recrĂ©er un manuscrit complet.

Quand Ă  la lecture, on sait que le modĂšle fonctionne sur certains fragments. Mais il est encore trop tĂŽt pour dire s’il fonctionnera sur l’ensemble du rouleau. Peut-ĂȘtre que d’autres couches, ou d’autres rĂ©gions du rouleau, auront des propriĂ©tĂ©s lĂ©gĂšrement diffĂ©rentes. Et les indices permettant de dĂ©tecter l’encre sont tellement subtils qu’il suffirait de pas grand-chose pour que le modĂšle soit Ă  nouveau perdu.

Mais aujourd’hui, il semble assez probable qu’on finira par y arriver, et dans pas trop longtemps. Et qu’on pourra enfin dĂ©couvrir le contenu de cette bibliothĂšque enfouie, et peut-ĂȘtre mettre la main sur des textes perdus depuis prĂȘt de 2000 ans.

Il y a en tout cas une certaine motivation pour les chercheurs sur le coup: l’équipe qui arrivera Ă  dĂ©chiffrer quatre passages sĂ©parĂ©s d’au moins 140 caractĂšres successifs dans les deux rouleaux imagĂ©s avant le 31 dĂ©cembre 2023 remportera $700.000.

Si ce post vous fait réagir, vous pouvez contacter l'auteur (moi) par mail: adrien@adfoucart.be

DerniĂšres publications

📄 Toutes les archives