HyperAI

LED-Datensatz Für Lateinische Inschriften

Datum

vor 9 Tagen

Organisation

DeepMind

Veröffentlichungs-URL

github.com

Kategorien

Download-Hilfe

LED ist der bislang größte maschinenlesbare Datensatz lateinischer Inschriften und wurde 2025 von Google DeepMind veröffentlicht. Das zugehörige Papier ist „Kontextualisierung antiker Texte mit generativen neuronalen Netzwerken".

Der Datensatz enthält insgesamt 176.861 Inschriften, die meisten davon sind jedoch teilweise beschädigt, und nur 51 TP3T-Inschriften können brauchbare entsprechende Bilder erzeugen. Die Daten stammen aus den drei umfassendsten lateinischen Inschriftendatenbanken: der Roman Inscription Database (EDR), der Heidelberg Inscription Database (EDH) und der Clauss-Slaby Database, die Inschriften vom 7. Jahrhundert v. Chr. bis zum 8. Jahrhundert n. Chr. enthalten. Die geografische Abdeckung reicht von den römischen Provinzen Britannia (heute Britannien) und Lusitania (Portugal) im Westen bis nach Ägypten und Mesopotamien (Irak) im Osten.