HyperAIHyperAI
منذ 8 أيام

نماذج التمييز النصي القائمة على المحولات

Xiang Zhang, Yongwen Su, Subarna Tripathi, Zhuowen Tu
نماذج التمييز النصي القائمة على المحولات
الملخص

في هذه الورقة، نقدم إطار عمل التعرف على النص باستخدام المحولات (TESTR)، وهو إطار عام قائم على المحولات (Transformers) للتنبؤ بالنص وتحديد نصوصه في البيئات الطبيعية بشكل مباشر ونهائي. يعتمد TESTR على مُشفّر واحد وناتجين (Decoders) مزدوجين لتنفيذ التنبؤ المشترك بنقاط التحكم في مربعات النص وتحديد الرموز. على عكس معظم الأدبيات الحالية، لا يعتمد منهجنا على عمليات مناطق الاهتمام (Region-of-Interest) أو على عمليات ما بعد المعالجة القائمة على قواعد حسابية (heuristics-driven post-processing)؛ ويُعد TESTR فعّالًا بشكل خاص عند التعامل مع مربعات نصية منحنية، حيث تتطلب هذه الحالات رعاية خاصة لتكيف تمثيلات المربعات المستطيلة التقليدية. نُظهر تمثيلنا القياسي لنقاط التحكم، الذي يناسب حالات النصوص المُعَلَّمة باستخدام كل من تمثيلات المنحنيات البيزية (Bezier curve) وتمثيلات المضلعات (polygon annotations). بالإضافة إلى ذلك، قمنا بتصميم عملية كشف المضلعات الموجهة بواسطة المربعات (box-to-polygon)، والتي تُحسّن دقة الكشف عن الأشكال غير المنتظمة. أظهرت التجارب على مجموعات بيانات ذات أشكال منحنية وعشوائية أداءً متفوقًا على المستوى العالمي (state-of-the-art) للخوارزمية المقترحة TESTR.

نماذج التمييز النصي القائمة على المحولات | أحدث الأوراق البحثية | HyperAI