HyperAIHyperAI
منذ 2 أشهر

اكتشاف النصوص المتعددة الاتجاهات في المشهد من خلال تحديد الزوايا وتقسيم المنطقة

Lyu, Pengyuan ; Yao, Cong ; Wu, Wenhao ; Yan, Shuicheng ; Bai, Xiang
اكتشاف النصوص المتعددة الاتجاهات في المشهد من خلال تحديد الزوايا وتقسيم المنطقة
الملخص

يمكن تصنيف طرق الكشف عن النصوص في المشاهد التي تعتمد على التعلم العميق وتعتبر الأكثر تقدماً حاليًا إلى فئتين رئيسيتين تقريبًا. الفئة الأولى تتعامل مع النصوص في المشاهد كنوع من الأشياء العامة وتتبع نموذج الكشف عن الأشياء العامة لتحديد مواقع النصوص من خلال تقدير مواقع الصناديق النصية، ولكنها تعاني من اتجاهات النصوص العشوائية وأطوالها الكبيرة. أما الفئة الثانية فتقوم بتقسيم المناطق النصية مباشرة، ولكنها غالبًا ما تحتاج إلى معالجة ما بعد التعقيد. في هذا البحث، نقدم طريقة تجمع بين أفكار هاتين الفئتين بينما تتجنب عيوبهما. نقترح الكشف عن النصوص في المشاهد من خلال تحديد نقاط الزوايا للصناديق النصية وتقسيم المناطق النصية في المواقع النسبية. في مرحلة الاستدلال، يتم إنشاء صناديق مرشحة من خلال أخذ عينات ومجموعات من نقاط الزوايا، والتي يتم تقييمها بشكل أكبر بواسطة خرائط التقسيم وإقصاؤها بواسطة NMS (Non-Maximum Suppression). بالمقارنة مع الطرق السابقة، يمكن لطريقتنا التعامل مع النصوص الطويلة ذات الاتجاهات المختلفة بشكل طبيعي ولا تحتاج إلى معالجة ما بعد التعقيد. تظهر التجارب على مجموعات البيانات ICDAR2013 وICDAR2015 وMSRA-TD500 وMLT وCOCO-Text أن الخوارزمية المقترحة تحقق نتائج أفضل أو مقاربة في الدقة والكفاءة. بناءً على VGG16، فإنها تحقق قياس F (F-measure) بنسبة 84.3% على ICDAR2015 و81.5% على MSRA-TD500.

اكتشاف النصوص المتعددة الاتجاهات في المشهد من خلال تحديد الزوايا وتقسيم المنطقة | أحدث الأوراق البحثية | HyperAI