HyperAIHyperAI
منذ 2 أشهر

تحليل الشبكات العصبية المت convoled لتصنيف صور الوثائق

Chris Tensmeyer; Tony Martinez
تحليل الشبكات العصبية المت convoled لتصنيف صور الوثائق
الملخص

الشبكات العصبية المتلافهة (CNNs) هي نماذج متطورة لمهام تصنيف صور الوثائق. ومع ذلك، تعتمد العديد من هذه النماذج على معلمات وبنية تحتية مصممة لتصنيف الصور الطبيعية، والتي تختلف عن صور الوثائق. نتساءل عما إذا كان هذا مناسبًا ونقوم بدراسة تجريبية واسعة للبحث في الجوانب التي تؤثر بشكل أكبر على أداء الشبكات العصبية المتلافهة على صور الوثائق. من بين النتائج الأخرى، نتفوق على أفضل النماذج الحالية في مجموعة بيانات RVL-CDIP باستخدام زيادة البيانات عبر تحويل القص (shear transform) وبنيان تحتي مصمم لصور إدخال أكبر. بالإضافة إلى ذلك، نحلل الميزات المُتعلَّمة ونجد أدلة على أن الشبكات العصبية المتلافهة التي تم تدريبها على RVL-CDIP تتعلم ميزات التخطيط الخاصة بالمناطق.

تحليل الشبكات العصبية المت convoled لتصنيف صور الوثائق | أحدث الأوراق البحثية | HyperAI