HyperAIHyperAI

Command Palette

Search for a command to run...

SRFormer: نموذج تحويل النص يدمج التجزئة والانحدار

Qingwen Bu Sungrae Park Minsoo Khang Yichuan Cheng

الملخص

يمكن تصنيف التقنيات الحالية للكشف عن النص بشكل عام إلى مجموعتين رئيسيتين: الأساليب القائمة على التجزئة (segmentation-based) والأساليب القائمة على الانحدار (regression-based). تتميز نماذج التجزئة بقدرتها العالية على التحمل تجاه التغيرات في الخطوط، لكنها تتطلب معالجة ما بعدية معقدة، مما يؤدي إلى عبء حسابي مرتفع. أما الأساليب القائمة على الانحدار، فهي تُجري تنبؤًا واعيًا بالكائنات، لكنها تواجه قيودًا في الموثوقية وكفاءة البيانات بسبب اعتمادها على تمثيلات عالية المستوى. في سياق بحثنا الأكاديمي، نقترح نموذج SRFormer، وهو نموذج موحد مبني على مبدأ DETR، يدمج بين التجزئة والانحدار، بهدف الاستفادة التآزرية من الموثوقية الطبيعية في تمثيلات التجزئة، إلى جانب المعالجة ما بعدية بسيطة تتم على مستوى الكائنات. تشير التحليلات التجريبية إلى أن التنبؤات المتميزة في التجزئة يمكن الحصول عليها في الطبقات الأولية من المُفكك (decoder). وبناءً على ذلك، نقيّد إدخال فروع التجزئة إلى الطبقات الأولى من المُفكك، ونستخدم تحسينًا تدريجيًا للانحدار في الطبقات اللاحقة، مما يحقق تحسينًا في الأداء مع الحد الأدنى من العبء الحسابي الناتج عن الخريطة (mask). علاوةً على ذلك، نقترح وحدة تحسين الاستعلام المُوجَّهة بالخريطة (Mask-informed Query Enhancement). نأخذ نتيجة التجزئة كمنطقة مُهتمة طبيعية (soft-ROI) لاستخلاص تمثيلات بيكسلية قوية، والتي تُستخدم بعدها لتعزيز تنوع وفعالية الاستعلامات الخاصة بالكائنات. وقد أظهرت التجارب الواسعة عبر عدة معايير نتائج مثيرة، تبرز من خلالها موثوقية استثنائية لطرقنا، وفعالية متفوقة في التدريب وكفاءة عالية في استخدام البيانات، إلى جانب أداء متميز على مستوى الحد الأدنى (state-of-the-art). يمكن الاطلاع على الكود الخاص بنا عبر الرابط التالي: https://github.com/retsuh-bqw/SRFormer-Text-Det.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp