HyperAIHyperAI

Command Palette

Search for a command to run...

نماذج التمييز النصي القائمة على المحولات

Xiang Zhang Yongwen Su Subarna Tripathi Zhuowen Tu

الملخص

في هذه الورقة، نقدم إطار عمل التعرف على النص باستخدام المحولات (TESTR)، وهو إطار عام قائم على المحولات (Transformers) للتنبؤ بالنص وتحديد نصوصه في البيئات الطبيعية بشكل مباشر ونهائي. يعتمد TESTR على مُشفّر واحد وناتجين (Decoders) مزدوجين لتنفيذ التنبؤ المشترك بنقاط التحكم في مربعات النص وتحديد الرموز. على عكس معظم الأدبيات الحالية، لا يعتمد منهجنا على عمليات مناطق الاهتمام (Region-of-Interest) أو على عمليات ما بعد المعالجة القائمة على قواعد حسابية (heuristics-driven post-processing)؛ ويُعد TESTR فعّالًا بشكل خاص عند التعامل مع مربعات نصية منحنية، حيث تتطلب هذه الحالات رعاية خاصة لتكيف تمثيلات المربعات المستطيلة التقليدية. نُظهر تمثيلنا القياسي لنقاط التحكم، الذي يناسب حالات النصوص المُعَلَّمة باستخدام كل من تمثيلات المنحنيات البيزية (Bezier curve) وتمثيلات المضلعات (polygon annotations). بالإضافة إلى ذلك، قمنا بتصميم عملية كشف المضلعات الموجهة بواسطة المربعات (box-to-polygon)، والتي تُحسّن دقة الكشف عن الأشكال غير المنتظمة. أظهرت التجارب على مجموعات بيانات ذات أشكال منحنية وعشوائية أداءً متفوقًا على المستوى العالمي (state-of-the-art) للخوارزمية المقترحة TESTR.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp