العمق والشمولية والإبداع في التعميم النطقي

مشكلة التعميم بين المجالات تتمثل في التعلم من عدة مجالات تدريبية واستخلاص نموذج مستقل عن المجال يمكن تطبيقه على مجال غير مُشاهد سابقًا. يتمتع التعميم بين المجالات (DG) بحافز واضح في السياقات التي تحتوي على مجالات مستهدفة ذات خصائص مميزة، ولكن بيانات التدريب فيها نادرة. على سبيل المثال، التعرف على الصور المخططة، والتي تكون أكثر إبهامًا وأقل شيوعًا من الصور الفوتوغرافية. ومع ذلك، تم تقييم طرق DG بشكل أساسي على مقاييس مرجعية تعتمد فقط على الصور الفوتوغرافية وتركز على تخفيف الانحياز في مجموعة البيانات حيث يمكن أن تكون مشكلتا تمييز المجال وندرة البيانات ضئيلتين. نعتقد أن هذه المقاييس المرجعية بسيطة جدًا، ونظهر أن النماذج الأساسية للتعلم العميق البسيطة تؤدي بشكل مفاجئ جيد عليها. في هذا البحث، نقدم مساهمتين رئيسيتين: أولاً، نبني على الخصائص المفضلة للتحمل أمام تحول المجال لدى طرق التعلم العميق ونطور نموذج CNN معараметر ذو رتبة منخفضة للتعلم الشامل DG من البداية إلى النهاية. ثانيًا، نطور مجموعة بيانات مرجعية لـ DG تغطي مجالات الصور الفوتوغرافية والمخططة والرسوم المتحركة واللوحات الفنية. هذه المجموعة أكثر صلة عملية وأصعب (تحول أكبر بين المجالات) من المقاييس المرجعية الموجودة حاليًا. تُظهر النتائج أن طريقة عملنا تتفوق على بدائل DG الحالية وأن مجموعة بياناتنا توفر تحديًا أكثر أهمية لـ DG لتحفيز الأبحاث المستقبلية.