HyperAI

Des Données Haute Fidélité D'os D'oracle Ont Été Renvoyées En Chine, L'ia a Aidé À Interpréter Des Textes Anciens Et De Nouvelles Images D'os D'oracle Ont Été Découvertes

特色图像

« L’année prochaine, nous irons en France pour ramener les os de l’oracle à la maison. » Fin décembre 2024, des chercheurs du Laboratoire clé de traitement de l'information sur les os d'oracle du ministère de l'Éducation de l'Université normale d'Anyang se sont rendus en France et ont signé un accord de coopération avec quatre institutions de collection d'os d'oracle, dont la Bibliothèque nationale de France. Ils « ramèneront à la maison » l’héritage culturel des os d’oracle qui a été éloigné de sa patrie pendant longtemps sous forme numérique.

5 août 2024Le « Global Oracle Digital Return Project » a officiellement démarré.Le directeur du laboratoire, Liu Yongge, a conduit les membres de l'équipe Zhang Zhan, Li Bang, Guo An et Gong Mufan à se rendre en Corée du Sud et a ramené des données haute fidélité de sept morceaux d'os d'oracle le 13 août.C'est également la première fois que le patrimoine culturel des os d'oracle de mon pays, perdu à l'étranger, revient dans son pays d'origine sous forme numérique.

En juin 2024, le directeur Liu Yongge, en collaboration avec des chercheurs de l'Université des sciences et technologies de Huazhong, de l'Université d'Adélaïde et de l'Université de technologie de Chine du Sud, a utilisé un modèle génératif basé sur l'image pour former un modèle de diffusion conditionnelle, Oracle Bone Script Decipher (OBSD), optimisé pour le déchiffrement des scripts Oracle Bone.Les résultats de la recherche ont non seulement été sélectionnés pour l'ACL 2024, mais ont également remporté avec succès le prix du meilleur article.

* Cliquez ici pour le rapport détaillé : Sélectionné pour l'ACL 2024 ! En présentant l'apprentissage zéro coup, l'Université des sciences et technologies de Huazhong publie un modèle de diffusion conditionnelle optimisé pour le déchiffrement des inscriptions sur os d'oracle

Auparavant, le laboratoire avait également créé une plate-forme de big data de scripts osseux oracle appelée « Yin Qi Wen Yuan » qui intègre la bibliothèque de documents de scripts osseux oracle, la bibliothèque de catalogues et la bibliothèque de caractères, et l'a ouverte au monde.Il s’agit de la plateforme de données Oracle la plus complète, la plus standardisée et la plus fiable au monde.Son ouverture marque l’entrée de la recherche sur les os d’oracle dans l’ère intelligente.

En effet, ces dernières années, l’IA a été progressivement appliquée plus en profondeur dans le domaine de la recherche sur la littérature chinoise ancienne. Tout en accélérant l'efficacité du travail des chercheurs, il est même devenu un « maître » dans la découverte des mystères de l'histoire.

L'interprétation des textes anciens vaut mille pièces d'or

En 2016, le Musée de l'écriture chinoise a publié une annonce de récompense : pour les résultats de recherche qui ont permis de déchiffrer les inscriptions sur os d'oracle non déchiffrées et qui ont été approuvés par un comité d'experts, une récompense de 100 000 yuans serait accordée pour chaque caractère. On peut dire que « chaque mot vaut mille pièces d’or ». Bien que la récompense soit généreuse, seuls environ 1 160 des près de 4 000 caractères uniques des inscriptions sur os d'oracle ont été déchiffrés, et il reste encore plus de 2 000 caractères à explorer. Le travail d’interprétation des caractères anciens est encore loin d’être terminé.

Dans la recherche historique traditionnelle, l’interprétation des personnages anciens est un processus complexe.

Tout d’abord, vous devez effectuer un « étalonnage ».Il s'agit de trier et de relire les films lourds. Depuis la découverte des inscriptions sur os d'oracle, environ 150 000 morceaux d'os d'oracle ont été déterrés. Ces os d'oracle sont passés entre différentes mains, laissant derrière eux de multiples frottements. Ces différents frottages du même os d'oracle sont appelés « pièces répliquées » et constituent des matériaux importants pour l'interprétation des inscriptions sur les os d'oracle. Il existe un grand nombre de fragments d'os d'oracle de qualité variable, et ils reposent principalement sur la relecture à l'œil nu des chercheurs, qui dépend fortement de l'expérience et qui prend du temps et demande beaucoup de travail.

La deuxième étape est l’interprétation formelle.La première étape consiste à observer et à analyser en détail les caractères anciens et à identifier leurs traits et leur structure. Ensuite, en se basant sur les caractéristiques des glyphes et en combinant les connaissances de base sur la culture, les coutumes et la religion anciennes, la signification originale de chaque caractère est déduite. Au cours du processus d’interprétation, les caractères anciens sont placés dans le contexte historique spécifique et le système phonétique dans lesquels ils sont apparus, et leur signification et leur utilisation à l’époque sont analysées. Dans le même temps, ils sont comparés à des mots apparentés du chinois moderne ou d’autres langues anciennes pour déterminer leur évolution sémantique et leurs relations étymologiques. Cela exige des chercheurs qu’ils disposent d’un vaste savoir professionnel et qu’ils soient capables de percer le mystère comme un détective et de tirer des conclusions d’un cas à l’autre.

Heureusement, l’IA peut nous aider dans ce voyage où chaque mot compte.

Le travail d’étalonnage nécessite de comparer et de traiter des quantités massives de données et d’en extraire des informations utiles, ce qui est exactement ce que l’IA fait de mieux. En 2022, Microsoft Research Asia (MRSA) travaillera surLe chercheur Wu Zhirong a formé un algorithme de réseau neuronal profond d'apprentissage auto-supervisé - Oracle Revision Assistant Diviner.Après avoir saisi 180 000 frottis numériques dans Diviner, celui-ci a non seulement fourni un lot plus complet et plus clair d'images d'os d'oracle, mais également de nombreuses nouvelles découvertes surprenantes :

Une nouvelle image lourde et différente

Comme le montre l'image ci-dessous, celui de gauche est un ancien frottage incomplet d'os d'oracle. Celui de droite est un estampage ultérieur. Il ne reste qu'une partie de l'os de l'oracle car il est cassé. Bien qu'il ait été entièrement copié, il est encore très incomplet. En superposant les deux frottages, une image plus complète de l'os d'oracle a été obtenue, en particulier l'affichage complet d'une section du texte de l'os d'oracle dans la partie supérieure droite, ce qui a directement fourni du nouveau matériel pour la recherche sur l'os d'oracle.

Les deux frottages ont été superposés pour obtenir une image complète de l'os oraculaire.

De nouvelles images avec du contenu

Certains os d'oracle ont des écritures sur les deux faces, mais parfois, il ne reste que des traces de frottement sur une face. Par exemple, M. Ma Baochun a découvert un jour que ces deux versions des frottages inversés pouvaient être jointes ensemble. Mais aucune image frontale de l’une des pièces n’a jamais été retrouvée. Le devin a découvert un frottement complet de l'avant et de l'arrière de l'os d'oracle ci-dessous, et l'image restaurée sur le devant a finalement été présentée.

Sur la base de l'étalonnage Diviner, l'image restaurée par concaténation avant est obtenue.

Du re-filmage à la conjugaison

L'image de gauche représente deux morceaux d'os d'oracle qui ont été cousus ensemble par M. Zhang Yuwei dans le passé. Grâce à la relecture de Diviner, il a été découvert que le frottement inférieur avait en fait une nouvelle pièce plus complète. De cette façon, la combinaison de deux morceaux d’os d’oracle s’est transformée en une combinaison de trois morceaux d’os d’oracle.

Conjugaison des os de l'oracle

Du flou à la clarté

Parce que certains frottis d'os d'oracle sont de mauvaise qualité et que les caractères qui y figurent sont difficiles à reconnaître, ils causent beaucoup de problèmes aux spécialistes des os d'oracle. Comme le montre l'image ci-dessous, le texte sur le frottage flou était difficile à reconnaître jusqu'à ce que le nouveau frottage clair soit découvert, ce qui a résolu de nombreux doutes passés.

L’interprétation des inscriptions sur os d’oracle repose actuellement principalement sur le travail manuel d’experts, mais l’application de l’IA devrait simplifier ce processus et le rendre plus efficace. Le 27 mai de cette année,La plateforme de collaboration Oracle AI « Yin Qi Wen Yuan » de Tencent est officiellement lancée.

Yinqiwenyuan vise à fournir des systèmes et des outils techniques matures et standardisés pour aider à améliorer l'efficacité de la recherche sur les os d'oracle.Les chercheurs peuvent utiliser la visionneuse d'informations complètes interactive Oracle Bone,Visualisez et comparez différentes versions numérisées d'os d'oracle, y compris des photos historiques, des modèles 3D haute résolution, des fac-similés numériques et des frottements numériques améliorés, côte à côte ou empilés.

La plate-forme améliorée Yinqi Wenyuan introduit une variété d'outils qui répondent directement aux principaux défis rencontrés dans la recherche sur les os d'oracle : la visualisation et la reconnaissance de texte. Parce que les os d’oracle sont fragiles et facilement cassables, et qu’ils constituent de véritables trésors inestimables, les chercheurs ne peuvent généralement pas y accéder directement. De plus, le fait que les fragments d’os d’oracle soient dispersés à travers la Chine et dans le monde entier augmente encore la difficulté de la recherche.

Pendant longtemps, les chercheurs ont dû comparer chaque image, parfois même en s’appuyant sur des notes dessinées à la main pour trouver des glyphes répétés, un processus long et laborieux. Désormais, les fonctions assistées par l’IA peuvent considérablement améliorer l’efficacité et la précision du déchiffrement des os d’oracle.De plus, grâce à la technologie d’amélioration des microtraces, les chercheurs ont pu voir les marques les plus superficielles sur les os de l’oracle.Cela leur permet d'analyser plus facilement en détail les traits des os d'oracle et les rainures bien définies à l'arrière des os.

Utilisation de la technologie d'amélioration des micro-traces pour observer des marques superficielles sur les os d'oracle

Pour faciliter la recherche, chaque mot d'os d'oracle a été indexé, afin que les chercheurs et les passionnés puissent rapidement trouver des articles universitaires pertinents et mener des recherches plus approfondies, ce qui réduit considérablement le temps de traitement des os d'oracle.

L'IA aide à transformer la pierre en or

Si le travail d'identification d'un texte à partir de gravures vaut mille pièces d'or, alors déchiffrer un « livre sans mots » semble être un conte de fées où la pierre se transforme en or.

Dans le cadre du défi Vesuvius lancé par Nat Friedman, Daniel Gross et Brent Seales, trois jeunes se sont associés à l'IA pour découvrir le mystère des Elder Scrolls (Herculaneum Scrolls). Les rouleaux ont été enterrés et carbonisés par une éruption volcanique en 79 après J.-C. et n'ont été excavés qu'en 1752. Si vous ne faites pas attention, le rouleau fragile se transformera en fragments en quelques minutes et ne pourra pas être déplié par des moyens physiques.

En prenant des images CT du parchemin et en utilisant la technologie d'apprentissage automatique pour le segmenter et l'identifier, ils sont devenus des personnes capables de « voir » le texte sur le parchemin sans jamais l'ouvrir.

L'ancien stagiaire de SpaceX, Luke Farritor, a formé un modèle d'apprentissage automatique sur des modèles de fissures et a découvert avec succès un mot entier ΠΟΡΦΥΡΑϹ, qui signifie « violet ». Il forme alors une équipe de trois personnes avec Youssef et Julian.Plus de 2 000 caractères ont été analysés.On pense que le contenu est lié à la philosophie épicurienne. Dans deux passages consécutifs de ce rouleau, l’auteur examine si et comment la disponibilité des biens (comme la nourriture) affecte le plaisir qu’ils peuvent apporter.

* Épicure était un philosophe grec ancien qui a proposé la théorie atomique dans le domaine des sciences naturelles, ce qui a eu une influence importante sur le développement de l'éthique et de la psychologie dans les générations ultérieures.

Cette réalisation a dynamisé le monde habituellement lent des études antiques et a établi un nouveau paradigme dans la recherche archéologique. Les chercheurs pensent que cela multipliera le volume des découvertes de poésie, de théâtre et de philosophie grecques et romaines antiques, dont certaines pourraient réécrire complètement l’histoire des périodes clés du monde antique.

Passé et futur, ruée vers l'or technologique

L’IA ne se limite pas à l’interprétation des os d’oracle, elle offre également des perspectives d’application extrêmement vastes dans d’autres aspects de l’histoire. Par exemple, prédire l’emplacement de sites non découverts, effectuer une restauration et une reconstruction numériques et déterminer l’âge et l’origine des objets.

Des chercheurs ont combiné des algorithmes d’apprentissage automatique avec la technologie LiDAR (Light Detection and Ranging) pour révéler des structures et des colonies mayas jusque-là cachées sous la couverture forestière d’Amérique centrale. Dans la région de Petén au Guatemala, l’IA a identifié plus de 60 000 structures mayas jusqu’alors inconnues, notamment des pyramides, des palais et des chaussées.

De plus, je crois que tout le monde connaît les reliques culturelles numériques. L'équipe de Wen Shaoqing de l'Institut d'archéologie scientifique et technologique de l'Université Fudan a utilisé des sondes de capture spécifiquement adaptées à l'ADN ancien pour obtenir environ 1 million de sites génétiques disponibles à partir d'échantillons d'os des membres de l'empereur Wu des Zhou du Nord, restaurant ainsi des caractéristiques clés de l'empereur Wu des Zhou du Nord telles que les cheveux, la peau et les pupilles. Le portrait de l'empereur Wu des Zhou du Nord, Yuwen Yong, a été restauré.

La convergence de la technologie et de l’exploration historique marque une nouvelle ère dans l’historiographie, dans laquelle le passé et le futur se rencontrent pour éclairer l’histoire de l’humanité. À l’avenir, avec l’application plus approfondie des technologies émergentes telles que l’IA dans ce domaine, nous pourrons peut-être avoir un aperçu d’histoires historiques plus mystérieuses et plus merveilleuses.

Références :

1.https://www.anyang.gov.cn/2025/01-02/2459358.html