Des chercheurs développent une reconnaissance automatique de texte pour les anciennes tablettes cunéiformes

Scannez los angeles tablette. Crédit : Uni Haley/Mike Gloeckner

Une nouvelle utility d’intelligence artificielle (IA) développée par une équipe de l’Université Martin Luther de Halle-Wittenberg (MLU), de l’Université Johannes Gutenberg de Mayence et de l’Université des sciences appliquées de Mayence est désormais succesful de déchiffrer des textes difficiles à lire sur des tablettes cunéiformes.

Au lieu de pictures, le système d’IA utilise des modèles 3D des tablettes, fournissant des résultats beaucoup plus fiables que les méthodes précédentes. Cela permet de rechercher le contenu de plusieurs tablettes pour les comparer entre eux. Cela ouvre également los angeles voie à des questions de recherche entièrement nouvelles. Les résultats sont publiés dans Affiliation eurographique revue.

Dans leur nouvelle approche, les chercheurs ont utilisé des modèles 3D de près de 2 000 tablettes cunéiformes, dont une cinquantaine du groupe MLU. Selon les estimations, il existe encore environ un million de ces tablettes dans le monde. Beaucoup d’entre eux ont plus de 5 000 ans et comptent donc parmi les paperwork écrits les plus anciens de l’humanité.

Ils couvrent un éventail de sujets extrêmement massive. “On y trouve de tout : des listes de classes aux décisions de justice”, explique Hubert Marat, assistant. “Les tablettes offrent un aperçu du passé de l’humanité il y a plusieurs milliers d’années. Cependant, elles sont fortement altérées et donc difficiles à déchiffrer, même pour les humains.” des yeux exercés.” “. Professeur à MLU.

En effet, les tablettes cunéiformes sont des morceaux d’argile non cuite sur lesquels une écriture est pressée. Pour compliquer encore les choses, le système d’écriture était très complexe et comprenait plusieurs langues. Par conséquent, non seulement des stipulations d’éclairage idéales sont nécessaires pour reconnaître correctement les symboles, mais de nombreuses connaissances de base sont également nécessaires. “Jusqu’à présent, il était difficile d’accéder simultanément au contenu de plusieurs tablettes cunéiformes. Il faut savoir exactement quoi chercher et où le chercher”, ajoute Marra.

Son laboratoire a european l’idée de développer un système d’intelligence artificielle basé sur des modèles 3D. Le nouveau système décode les caractères mieux que les méthodes précédentes. En principe, le système d’IA fonctionne de los angeles même manière qu’un logiciel de reconnaissance optique de caractères (OCR), qui convertit les pictures d’écriture et de texte en texte lisible par system.

Cela présente de nombreux avantages. Une fois converti en texte informatique, l’écrit peut être lu ou recherché plus facilement. “L’OCR fonctionne généralement avec des photographies ou des numérisations. Ce n’est pas un problème pour l’encre sur papier ou parchemin. Cependant, dans le cas des tablettes cunéiformes, les choses sont plus difficiles automobile los angeles lumière et l’attitude de vue affectent grandement los angeles capacité à reconnaître des lettres spécifiques, » explique Ernst Stuttner de MLU. Il a développé le nouveau système d’intelligence artificielle dans le cadre de son mémoire de maîtrise sous los angeles route d’Hubert Marat.

L’équipe a formé le nouveau logiciel d’IA à l’aide de scans 3D et de données supplémentaires. Une grande partie de ces données ont été fournies par l’Université des sciences appliquées de Mayence, qui supervise un grand projet d’influence de modèles 3D de tablettes d’argile. Le système d’IA a alors reconnu de manière fiable les icônes présentes sur les tablettes. « Nous avons été surpris de constater que notre système fonctionne bien avec les photographies, qui constituent en réalité une supply de moindre qualité », explique Stotzner.

Les travaux des chercheurs de Halle et de Mayence ouvrent un nouvel accès à ce qui était jusqu’à présent un matériau relativement exclusif et ouvrent plusieurs nouvelles lignes de recherche. Jusqu’à présent, il ne s’agissait que d’un prototype succesful de distinguer de manière fiable les symboles de deux langues. On connaît cependant l’life de douze langues cunéiformes. À l’avenir, le logiciel pourrait également permettre de déchiffrer les inscriptions cursives, par exemple dans les tombes, qui sont tridimensionnelles comme le cunéiforme.

Plus d’knowledge:
Ernst Stotzner et al., Methodology de détection de coin polygonal basée sur R-CNN tirée de démonstrations 3D et d’pictures cartographiées de tablettes cunéiformes de données ouvertes, Affiliation eurographique (2023). est ce que je: 10.2312/gch.20231157

Fourni par l’Université Martin Luther de Halle-Wittenberg

los angeles quotation: Des chercheurs développent une reconnaissance automatique de texte pour les anciennes tablettes cunéiformes (20 novembre 2023) Récupéré le 20 novembre 2023 sur

Ce file est soumis au droit d’auteur. Nonobstant toute utilisation équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans autorisation écrite. Le contenu est fourni à titre informatif uniquement.