منذ 7 أشهر

الملخص

الشبكات العصبية المتلافهة (CNNs) هي نماذج متطورة لمهام تصنيف صور الوثائق. ومع ذلك، تعتمد العديد من هذه النماذج على معلمات وبنية تحتية مصممة لتصنيف الصور الطبيعية، والتي تختلف عن صور الوثائق. نتساءل عما إذا كان هذا مناسبًا ونقوم بدراسة تجريبية واسعة للبحث في الجوانب التي تؤثر بشكل أكبر على أداء الشبكات العصبية المتلافهة على صور الوثائق. من بين النتائج الأخرى، نتفوق على أفضل النماذج الحالية في مجموعة بيانات RVL-CDIP باستخدام زيادة البيانات عبر تحويل القص (shear transform) وبنيان تحتي مصمم لصور إدخال أكبر. بالإضافة إلى ذلك، نحلل الميزات المُتعلَّمة ونجد أدلة على أن الشبكات العصبية المتلافهة التي تم تدريبها على RVL-CDIP تتعلم ميزات التخطيط الخاصة بالمناطق.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار