HyperAI

مجموعة بيانات نص الصورة SA-Text

التاريخ

منذ 2 أيام

المؤسسة

معهد كوريا المتقدم للعلوم والتكنولوجيا (KAIST)

رابط النشر

huggingface.co

مساعدة التنزيل

SA-Text هي مجموعة بيانات مرجعية واسعة النطاق لصور مشاهد عالية الجودة، أصدرها المعهد الكوري المتقدم للعلوم والتكنولوجيا وجامعة كوريا، وهي مصممة لاستعادة الصور النصية (TAIR). نتائج البحث ذات الصلة هي:استعادة الصور النصية باستخدام نماذج الانتشار".

تحتوي مجموعة البيانات على 105,330 صورة مشهد عالية الدقة مع تعليقات نصية على مستوى المضلع، والتي يمكنها وصف موقع وشكل النص في الصورة بدقة، مما يوفر معلومات إشرافية دقيقة لمهمة TAIR، مما يتيح للنموذج فهم موقع وبنية النص في الصورة بشكل أفضل.