HyperAIHyperAI
منذ 2 أشهر

شبكات التحول الصورية للمتعلمة بمرة واحدة

Zitian Chen; Yanwei Fu; Yu-Xiong Wang; Lin Ma; Wei Liu; Martial Hebert
شبكات التحول الصورية للمتعلمة بمرة واحدة
الملخص

يمكن للبشر تعلم مفاهيم بصرية جديدة بشكل قوي حتى عند خضوع الصور لتشوهات مختلفة وفقدان بعض المعلومات. تقليد هذا السلوك وإنتاج حالات مشوهة لمفاهيم جديدة قد يساعد أنظمة التعرف البصري على أداء أفضل في التعلم من مثال واحد أو عدد قليل من الأمثلة (التعلم الفردي). رؤيتنا الأساسية هي أنه بينما قد لا تكون الصور المشوهة واقعية بصرياً، فإنها ما زالت تحتفظ بمعلومات دلالية حاسمة وتساهم بشكل كبير في صياغة حدود القرار للمصنف. مستوحاة من التقدم الحديث في مجال التعلم الميتا (meta-learning)، نقوم بدمج متعلم ميتا مع شبكة فرعية لتشويه الصور تنتج أمثلة تدريب إضافية، ونقوم بتحسين كلا النموذجين بطريقة شاملة (end-to-end). تتعلم الشبكة الفرعية لتشويه الصور كيفية تشويه الصور عن طريق دمج زوج من الصور --- صورة استكشافية تحافظ على المحتوى البصري وصورة معرض تتنوع فيها التشوهات. نقدم نتائج على مقاييس التعلم الفردي الشائعة الاستخدام (مجموعتي بيانات miniImageNet و ImageNet 1K Challenge)، والتي تتفوق بشكل كبير على الطرق الرائدة في المجال. يمكن الحصول على الكود من الرابط: https://github.com/tankche1/IDeMe-Net.