HyperAIHyperAI
منذ 11 أيام

SRFormer: نموذج تحويل النص يدمج التجزئة والانحدار

Qingwen Bu, Sungrae Park, Minsoo Khang, Yichuan Cheng
SRFormer: نموذج تحويل النص يدمج التجزئة والانحدار
الملخص

يمكن تصنيف التقنيات الحالية للكشف عن النص بشكل عام إلى مجموعتين رئيسيتين: الأساليب القائمة على التجزئة (segmentation-based) والأساليب القائمة على الانحدار (regression-based). تتميز نماذج التجزئة بقدرتها العالية على التحمل تجاه التغيرات في الخطوط، لكنها تتطلب معالجة ما بعدية معقدة، مما يؤدي إلى عبء حسابي مرتفع. أما الأساليب القائمة على الانحدار، فهي تُجري تنبؤًا واعيًا بالكائنات، لكنها تواجه قيودًا في الموثوقية وكفاءة البيانات بسبب اعتمادها على تمثيلات عالية المستوى. في سياق بحثنا الأكاديمي، نقترح نموذج SRFormer، وهو نموذج موحد مبني على مبدأ DETR، يدمج بين التجزئة والانحدار، بهدف الاستفادة التآزرية من الموثوقية الطبيعية في تمثيلات التجزئة، إلى جانب المعالجة ما بعدية بسيطة تتم على مستوى الكائنات. تشير التحليلات التجريبية إلى أن التنبؤات المتميزة في التجزئة يمكن الحصول عليها في الطبقات الأولية من المُفكك (decoder). وبناءً على ذلك، نقيّد إدخال فروع التجزئة إلى الطبقات الأولى من المُفكك، ونستخدم تحسينًا تدريجيًا للانحدار في الطبقات اللاحقة، مما يحقق تحسينًا في الأداء مع الحد الأدنى من العبء الحسابي الناتج عن الخريطة (mask). علاوةً على ذلك، نقترح وحدة تحسين الاستعلام المُوجَّهة بالخريطة (Mask-informed Query Enhancement). نأخذ نتيجة التجزئة كمنطقة مُهتمة طبيعية (soft-ROI) لاستخلاص تمثيلات بيكسلية قوية، والتي تُستخدم بعدها لتعزيز تنوع وفعالية الاستعلامات الخاصة بالكائنات. وقد أظهرت التجارب الواسعة عبر عدة معايير نتائج مثيرة، تبرز من خلالها موثوقية استثنائية لطرقنا، وفعالية متفوقة في التدريب وكفاءة عالية في استخدام البيانات، إلى جانب أداء متميز على مستوى الحد الأدنى (state-of-the-art). يمكن الاطلاع على الكود الخاص بنا عبر الرابط التالي: https://github.com/retsuh-bqw/SRFormer-Text-Det.

SRFormer: نموذج تحويل النص يدمج التجزئة والانحدار | أحدث الأوراق البحثية | HyperAI