التعلم الذاتي للميتا لتمييز المجال متعدد المصادر: معيار تقييم

في السنوات الأخيرة، أظهرت الأساليب القائمة على التعلم العميق نتائج واعدة في مجال الرؤية الحاسوبية. ومع ذلك، تتطلب النماذج العميقة الشائعة كمية كبيرة من البيانات المُصنّفة، والتي يُعد جمعها وتسميتها عملية مرهقة وشاقة من حيث الموارد البشرية. علاوة على ذلك، يمكن أن تتضرر النماذج نتيجة لانزياح المجال بين بيانات التدريب وبيانات الاختبار. ويشكل اعتراف النصوص مجالًا واسع الانتشار في الرؤية الحاسوبية، ويعاني من نفس المشكلات المذكورة أعلاه نظرًا لتنوع الخطوط والخلفيات المعقدة. في هذا البحث، نركّز على مشكلة اعتراف النصوص، ونُقدّم ثلاث إسهامات رئيسية لمعالجة هذه التحديات. أولاً، قمنا بجمع مجموعة بيانات لتمثيل التكيف بين المصادر متعددة المجالات في مجال اعتراف النصوص، تضم خمسة مجالات مختلفة وتشمل أكثر من خمسة ملايين صورة، وهي أول مجموعة بيانات متعددة المجالات لاعتراف النصوص معروفًا لنا حتى الآن. ثانيًا، قمنا بطرح طريقة جديدة تُسمى "التعلم الذاتي المتعدد"، والتي تدمج بين منهجية التعلم الذاتي ونمط التعلم المتعدد (meta-learning)، وتحقق نتائج أفضل في سياق التكيف بين المجالات المتعددة. ثالثًا، أجرينا تجارب واسعة النطاق على هذه المجموعة لتقديم معيار مرجعي، كما أظهرت فعالية طريقة العمل المقترحة. ستكون الشفرة البرمجية لعملنا والبيانات متاحة قريبًا عبر الرابط: https://bupt-ai-cz.github.io/Meta-SelfLearning/.