Total-Text: مجموعة شاملة للكشف عن النصوص في المشاهد وتعرفها

النص المنحني، رغم كونه أحد اتجاهات النص الشائعة في البيئة الحقيقية، يكاد يكون غير موجود في مجموعات البيانات المشهورة للنصوص المشهدية مثل ICDAR2013 و MSRA-TD500. الهدف الرئيسي من Total-Text هو سد هذه الفجوة وتيسير اتجاه بحثي جديد لمجتمع النصوص المشهدية. بالإضافة إلى النصوص الأفقية والمتعددة الاتجاهات التقليدية، يتميز هذا المجموعة بالنصوص المنحنية. تتميز Total-Text بتنوع كبير في الاتجاهات، حيث أن أكثر من نصف صورها تحتوي على مزيج من أكثر من اتجاهين. مؤخرًا، أظهرت مجموعة جديدة من الحلول التي تعتبر الكشف عن النص كمشكلة تقسيم فعاليتها ضد النصوص المتعددة الاتجاهات. لتقدير قدرتها على مقاومة النصوص المنحنية، تم ضبط DeconvNet بشكل دقيق واختبارها على Total-Text. يمكن الحصول على Total-Text مع شروحاتها من الرابط https://github.com/cs-chan/Total-Text-Dataset