Restauration et attribution de textes anciens à l’aide de réseaux neuronaux profonds

L’histoire ancienne s’appuie sur des disciplines telles que l’épigraphie — l’étude des textes gravés, appelés inscriptions — afin de retrouver des traces de la pensée, du langage, de la société et de l’histoire des civilisations passées¹. Toutefois, au fil des siècles, de nombreuses inscriptions ont été endommagées au point de devenir illisibles, transférées loin de leur lieu d’origine, et leur date d’écriture reste souvent entourée d’incertitudes. Dans cet article, nous présentons Ithaca, un réseau neuronal profond conçu pour la restauration textuelle, l’attribution géographique et la datation des inscriptions grecques anciennes. Ithaca est conçu pour accompagner et enrichir le processus de travail des historiens. Son architecture repose sur la collaboration, l’aide à la décision et l’interprétabilité. Bien que Ithaca atteigne à lui seul une précision de 62 % dans la restauration des textes endommagés, son utilisation par les historiens a permis d’augmenter leur précision de 25 % à 72 %, confirmant ainsi l’effet synergique de cet outil de recherche. Ithaca parvient à attribuer les inscriptions à leur lieu d’origine avec une précision de 71 % et à les dater avec une marge inférieure à 30 ans par rapport à leurs intervalles véritables, permettant ainsi de redater des textes clés de l’Athènes classique et de contribuer à des débats actuels en histoire ancienne. Cette recherche démontre comment des modèles tels qu’Ithaca peuvent libérer le potentiel coopératif entre l’intelligence artificielle et les historiens, transformant radicalement la manière dont nous étudions et écrivons l’histoire d’une des périodes les plus importantes de l’humanité.