تقدير النظر التكيفي بقليل من الواردات

الاختلافات التشريحية بين الأفراد تحد من دقة شبكات تقدير النظر المستقلة عن الشخص. ومع ذلك، هناك حاجة لتقليل أخطاء النظر بشكل أكبر لتمكين التطبيقات التي تتطلب جودة أعلى. يمكن تحقيق مكاسب إضافية من خلال تخصيص شبكات النظر، المثالي هو باستخدام عينات قليلة لل-Calibration. ومع ذلك، فإن الشبكات العصبية المبالغ في تكوينها ليست مناسبة للتعلم من أمثلة قليلة حيث يمكن أن تتعرض بسرعة للـ Overfitting. نحن نواجه هذه التحديات ونقترح إطارًا جديدًا لتقدير النظر التكيفي القليل العينات (FAZE) لتعلم شبكات النظر الخاصة بالشخص باستخدام عينات قليلة جدًا (أقل من أو تساوي 9) لل-Calibration. يتعلم FAZE تمثيلًا خفيًا للنظر يدرك الدوران عبر هندسة كودر-فكودر فاصلة (Disentangling Encoder-Decoder) بالإضافة إلى مقدر نظر شديد التكيف تم تدريبه باستخدام التعلم الفائق (Meta-learning). يتمتع القدرة على التكيف مع أي شخص جديد لتحقيق مكاسب أداء كبيرة باستخدام ما لا يزيد عن 3 عينات، مما يؤدي إلى أداء رائد يبلغ 3.18 درجة على GazeCapture، وهو تحسن بنسبة 19% مقارنة بالأعمال السابقة. نحن نوفر الكود مفتوح المصدر على https://github.com/NVlabs/few_shot_gaze注释:- "Calibration" 翻译为 "ال-Calibration" 并在括号中标注原文,因为这是一个不太常见的术语。- "Overfitting" 翻译为 "الـ Overfitting" 并在括号中标注原文,因为这也是一个不太常见的术语。- "Disentangling Encoder-Decoder" 翻译为 "كودر-فكودر فاصلة" 并在括号中标注原文,以保持信息完整。- "Meta-learning" 翻译为 "التعلم الفائق",这是该术语的通用翻译。