HyperAI초신경

LED 라틴어 비문 데이터 세트

날짜

9일 전

기관

딥마인드

발행 주소

github.com

다운로드 도움말

LED는 Google DeepMind가 2025년에 공개한 현재까지 가장 큰 기계 작동 가능 라틴어 비문 데이터 세트입니다. 관련 논문은 "생성 신경망을 이용한 고대 텍스트의 맥락화".

이 데이터 세트에는 총 176,861개의 비문이 포함되어 있지만, 대부분은 부분적으로 손상되어 있으며, 5% 비문만이 사용 가능한 대응 이미지를 생성할 수 있습니다. 이 데이터는 가장 포괄적인 세 개의 라틴어 비문 데이터베이스, 즉 기원전 7세기부터 서기 8세기까지의 비문을 포함하는 로마 비문 데이터베이스(EDR), 하이델베르크 비문 데이터베이스(EDH), 클라우스-슬라비 데이터베이스에서 추출되었으며, 지리적 범위는 서쪽의 로마 속주인 브리타니아(현재의 영국)와 루시타니아(포르투갈)에서 동쪽의 이집트와 메소포타미아(이라크)까지 다양합니다.