Command Palette
Search for a command to run...
تحليل الشبكات العصبية المت convoled لتصنيف صور الوثائق
تحليل الشبكات العصبية المت convoled لتصنيف صور الوثائق
Chris Tensmeyer Tony Martinez
الملخص
الشبكات العصبية المتلافهة (CNNs) هي نماذج متطورة لمهام تصنيف صور الوثائق. ومع ذلك، تعتمد العديد من هذه النماذج على معلمات وبنية تحتية مصممة لتصنيف الصور الطبيعية، والتي تختلف عن صور الوثائق. نتساءل عما إذا كان هذا مناسبًا ونقوم بدراسة تجريبية واسعة للبحث في الجوانب التي تؤثر بشكل أكبر على أداء الشبكات العصبية المتلافهة على صور الوثائق. من بين النتائج الأخرى، نتفوق على أفضل النماذج الحالية في مجموعة بيانات RVL-CDIP باستخدام زيادة البيانات عبر تحويل القص (shear transform) وبنيان تحتي مصمم لصور إدخال أكبر. بالإضافة إلى ذلك، نحلل الميزات المُتعلَّمة ونجد أدلة على أن الشبكات العصبية المتلافهة التي تم تدريبها على RVL-CDIP تتعلم ميزات التخطيط الخاصة بالمناطق.