HyperAIHyperAI

Command Palette

Search for a command to run...

جسر الفجوة في الأداء بين DETR و R-CNN للكشف عن الكائنات الرسومية في صور الوثائق

Tahira Shehzadi Khurram Azeem Hashmi Didier Stricker Marcus Liwicki Muhammad Zeshan Afzal

الملخص

يُعد هذا البحث خطوة مهمة في تقليص الفجوة الأداء بين DETR و R-CNN في مجال كشف الأشياء الرسومية. لقد استفادت الأساليب الحالية لكشف الأشياء الرسومية من التحسينات الحديثة في طرق كشف الأشياء المستندة إلى CNN، مما أدى إلى تحقيق تقدم ملحوظ. مؤخرًا، ساهم الكاشفون المستندون إلى الـ Transformer بشكل كبير في تعزيز أداء كشف الأشياء العامة، مما ألغى الحاجة إلى الميزات المصممة يدويًا أو خطوات المعالجة اللاحقة مثل Non-Maximum Suppression (NMS) باستخدام استعلامات الأشياء. ومع ذلك، لم يتم التحقق بعد من فعالية هذه الخوارزميات المحسنة للكشف عن الأشياء المستندة إلى الـ Transformer فيما يتعلق بمشكلة كشف الأشياء الرسومية.بشكل أساسي، مستوحاة من التطورات الأخيرة في DETR، نستخدم الكاشف(transformer) الموجود مع بعض التعديلات البسيطة للكشف عن الأشياء الرسومية. نقوم بتعديل استعلامات الأشياء بطرق مختلفة، باستخدام النقاط والصناديق المرجعية وإضافة الضوضاء الإيجابية والسالبة إلى الصناديق المرجعية لتعزيز الأداء. تسمح هذه التعديلات بمعالجة أفضل للأجسام ذات الأحجام والنسب المختلفة، وزيادة المتانة تجاه التغيرات الصغيرة في مواقع وأحجام الأجسام، وتحسين تمييز الصور بين الأجسام وغير الأجسام. نقيم نهجنا على أربعة مجموعات بيانات رسومية: PubTables، TableBank، NTable و PubLaynet. بعد دمج تعديلات الاستعلامات في DETR، نتفوق على الأعمال السابقة ونحقق نتائج جديدة رائدة بأداء mAP بنسبة 96.9٪ على TableBank، 95.7٪ على PubLaynet و 99.3٪ على PubTables.نتائج الاختبارات الواسعة تظهر أن الأساليب المستندة إلى الـ Transformer أكثر فعالية لتحليل الوثائق مشابهة للتطبيقات الأخرى. نأمل أن يثير هذا البحث المزيد من الاهتمام بالدراسات المتعلقة باستخدام الكاشفات(transformers) في تحليل صور الوثائق.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp