HyperAI

SA-Text-Bildtextdatensatz

Datum

vor 2 Tagen

Organisation

KAIST Korea Advanced Institute of Science and Technology

Veröffentlichungs-URL

huggingface.co

Download-Hilfe

SA-Text ist ein umfangreicher Benchmark-Datensatz mit hochwertigen Szenenbildern, der vom Korea Advanced Institute of Science and Technology und der Korea University veröffentlicht wurde und für die textbasierte Bildwiederherstellung (TAIR) entwickelt wurde. Die Ergebnisse der Studie sind:Textbasierte Bildwiederherstellung mit Diffusionsmodellen".

Der Datensatz enthält 105.330 hochauflösende Szenenbilder mit Textanmerkungen auf Polygonebene, die die Position und Form des Textes im Bild genau beschreiben können und präzise Überwachungsinformationen für die TAIR-Aufgabe liefern, sodass das Modell die Position und Struktur des Textes im Bild besser verstehen kann.