Command Palette
Search for a command to run...
كشف النص في المشهد متعدد الاتجاهات من خلال تحديد الزوايا والتقسيم الإقليمي
كشف النص في المشهد متعدد الاتجاهات من خلال تحديد الزوايا والتقسيم الإقليمي
Lyu Pengyuan Yao Cong Wu Wenhao Yan Shuicheng Bai Xiang
الملخص
يمكن تصنيف الطرق المتطورة حديثًا القائمة على التعلم العميق للكشف عن النصوص في المشاهد إلى فئتين رئيسيتين. تُعامل الفئة الأولى النصوص في المشاهد كنوع من الكائنات العامة، وتتبع منهجية الكشف عن الكائنات العامة لتحديد مواقع النصوص من خلال الانحدار في مواقع مربعات النص، لكنها تواجه صعوبات بسبب الاتجاهات العشوائية وأطوال النسب الطولية الكبيرة للنصوص في المشاهد. أما الفئة الثانية، فهي تقوم بفصل مناطق النص مباشرة، لكنها غالبًا ما تتطلب معالجة ما بعدية معقدة. في هذا البحث، نقدم طريقة تجمع بين أفكار النوعين مع تجنب عيوبهما. نقترح الكشف عن النصوص في المشاهد من خلال تحديد نقاط الزوايا لمربعات حدود النص، وتقسيم مناطق النص وفقًا لمواقعها النسبية. وفي مرحلة الاستدلال، تُولَّد صناديق مرشحة من خلال عينة وتوحيد نقاط الزوايا، ثم تُقدَّم نقاط تقييم لها باستخدام خرائط التقسيم، وتُقلَّل بأسلوب القمع المتبقي (NMS). مقارنةً بالطرق السابقة، تُمكن هذه الطريقة من التعامل مع النصوص الطويلة المائلة بشكل طبيعي، ولا تتطلب معالجة ما بعدية معقدة. وقد أظهرت التجارب على مجموعات ICDAR2013 وICDAR2015 وMSRA-TD500 وMLT وCOCO-Text أن الخوارزمية المقترحة تحقق نتائج أفضل أو مماثلة من حيث الدقة والكفاءة. وباستخدام المعمارية VGG16، حققت قياسًا محسوبًا (F-measure) بلغ 84.3% على ICDAR2015 و81.5% على MSRA-TD500.