شبكة Wasserstein CNN: تعلم الخصائص الثابتة لتمييز الوجه في الصور القريبة من الحمراء والمرئية (NIR-VIS)

التعرف على الوجوه غير المتجانسة (HFR) يهدف إلى مطابقة صور الوجه التي تم الحصول عليها من وسائط استشعار مختلفة، مع تطبيقات حاسمة في مجالات العدالة الجنائية والأمن والقطاع التجاري. ومع ذلك، يعتبر التعرف على الوجوه غير المتجانسة مشكلة أكثر تحديًا بكثير من التعرف التقليدي على الوجوه بسبب التباين الكبير داخل الفئات لصور الوجه غير المتجانسة وندرة عينات التدريب من أزواج الصور بين الوسائط المختلفة. تقترح هذه الورقة نهجًا جديدًا يعرف بـ Wasserstein CNN (شبكات العصبونات المتلافهة، أو WCNN اختصارًا) لتعلم الخصائص الثابتة بين صور الوجه بالأشعة تحت الحمراء القريبة والصور المرئية (أي NIR-VIS التعرف على الوجوه). يتم تدريب الطبقات المنخفضة المستوى في WCNN باستخدام صور وجه متاحة بشكل واسع في الطيف المرئي. يتم تقسيم الطبقة العليا إلى ثلاثة أجزاء، وهي: الطبقة تحت الحمراء القريبة (NIR)، الطبقة المرئية (VIS)، والطبقة المشتركة بين NIR-VIS. تهدف أول طبقتين إلى تعلم الخصائص الخاصة بكل وسيط، بينما يتم تصميم الطبقة المشتركة بين NIR-VIS لتعلم فضاء خاص بالخصائص الثابتة عبر الوسائط. يتم تقديم المسافة Wasserstein في الطبقة المشتركة بين NIR-VIS لقياس الاختلاف بين توزيعات الخصائص غير المتجانسة. وبالتالي,则 W-CNN 的学习目标是实现近红外分布和可见光分布之间的 Wasserstein 距离最小化,以获得非均匀人脸图像的不变深度特征表示。为了避免在小规模非均匀人脸数据上出现过拟合问题,在 WCNN 网络的全连接层引入了相关先验来减少参数空间。这种先验通过在网络末端施加低秩约束来实现。联合公式导致在训练阶段对深度特征表示进行交替最小化,并在测试阶段对非均匀数据进行高效计算。在三个具有挑战性的近红外-可见光(NIR-VIS)人脸识别数据库上的广泛实验表明,Wasserstein CNN 在最先进的方法中具有显著的优势。为了使最后一部分更加流畅且符合阿拉伯语表达习惯,我将对其进行调整:لتجنب مشكلة الانطباق الزائد على بيانات الوجه غير المتجانسة ذات الحجم الصغير، تم إدخال قيد ارتباطي على الطبقات المتصلة بالكامل في شبكة WCNN لتقليل فضاء المعلمات. يتم تنفيذ هذا القيد عن طريق فرض قيد رتبة منخفضة في شبكة النهاية إلى النهاية. يؤدي الصيغة المشتركة إلى حد أدنى متبادل للتمثيل العميق للخصائص في مرحلة التدريب وحساب كفء للبيانات غير المتجانسة في مرحلة الاختبار. أظهرت التجارب الشاملة على ثلاث قواعد بيانات NIR-VIS للتعرف على الوجوه ذات التحديات الكبيرة أن Wasserstein CNN يتفوق بشكل كبير على الأساليب الأكثر تقدمًا حاليًا.