شبكة نقل الرسم المعرفي للتمييز القليل التدريب

يهدف التعلم من عدد قليل من الأمثلة (Few-shot learning) إلى تعلُّم فئات جديدة من خلال عدد ضئيل جدًا من الأمثلة، مع توفر عينات تدريب كافية لفئات أساسية محددة. التحدي الرئيسي في هذه المهمة يتمثل في أن الفئات الجديدة تكون عرضة للتأثر بشكل مفرط بالألوان أو النسيج أو الشكل الكلي للكائن أو السياق الخلفي (ما يُعرف بـ "الخصوصية")، وهي صفات تختلف في الأمثلة التدريبية القليلة المتوفرة ولكنها ليست شائعة في الفئات المقابلة (انظر الشكل 1). وبشكل مfortunate، وجدنا أن نقل المعلومات من الفئات الأساسية المرتبطة يمكن أن يساعد في تعلُّم المفاهيم الجديدة، وبالتالي تجنب تأثر المفهوم الجديد بالخصوصية. علاوةً على ذلك، يمكن للربط الدلالي بين الفئات المختلفة أن يُعدّل بشكل فعّال عملية نقل هذه المعلومات. في هذا العمل، نمثل العلاقات الدلالية على شكل رسم معرفي منظم (structured knowledge graph)، ونُدمج هذا الرسم في الشبكات العصبية العميقة لتعزيز التعلم من عدد قليل من الأمثلة من خلال شبكة نقل المعرفة المبتكرة (KGTN). وبشكل محدد، وباستخدام أوزان فاصل الفئة المقابلة لتوليد كل عقدة، نتعلم آلية انتشار لنقل رسالة العقدة بشكل تكيفي عبر الرسم، بهدف استكشاف التفاعل بين العقد ونقل معلومات الفاصل من الفئات الأساسية إلى الفئات الجديدة. أظهرت التجارب الواسعة على مجموعة بيانات ImageNet تحسنًا ملحوظًا في الأداء مقارنةً بالمنافسين الحاليين المُتقدّمين. علاوةً على ذلك، قمنا ببناء مجموعة بيانات ImageNet-6K التي تشمل عددًا أكبر من الفئات، أي 6000 فئة، وأظهرت التجارب على هذه المجموعة فعالية نموذجنا المقترح بشكل إضافي. تتوفر الشيفرة والنماذج الخاصة بنا على الرابط: https://github.com/MyChocer/KGTN.