Command Palette
Search for a command to run...
شبكات تجزئة النص المدمج للكشف عن النص المسرّع في المشاهد متعددة الاتجاهات
شبكات تجزئة النص المدمج للكشف عن النص المسرّع في المشاهد متعددة الاتجاهات
الملخص
في هذا البحث، نقدّم إطارًا جديدًا من نوع النهاية إلى النهاية للكشف عن النصوص المُتعددة الاتجاهات في المشاهد، من منظور التصنيف الدلالي الواعي بالكائنات. نُقدّم شبكة التصنيف النصي المُدمج (Fused Text Segmentation Networks)، التي تدمج الميزات متعددة المستويات أثناء استخراج الميزات، نظرًا لأن النصوص قد تعتمد على تعبيرات ميزات أكثر دقة مقارنةً بالكائنات العامة. ويتم اكتشاف النصوص وتصنيفها معًا وآنيًا، مستفيدًا من المزايا المتوفرة في كل من مهمة التصنيف الدلالي ومهام الكشف عن الكائنات القائمة على اقتراح المناطق. وبلا الحاجة إلى أي مسارات إضافية، يتفوق أسلوبنا على الحد الأقصى الحالي للتقنيات في معايير الكشف عن النصوص المُتعددة الاتجاهات في المشاهد: حيث حقق أداءً متوسطًا عاليًا (H-mean) بلغ 84.1% على مجموعة ICDAR2015 Incidental Scene Text، و82.0% على مجموعة MSRA-TD500. علاوةً على ذلك، نُقدّم قاعدة مقارنة (baseline) على مجموعة Total-Text التي تحتوي على نصوص منحنية، مما يُظهر فعالية الأسلوب المقترح.