HyperAIHyperAI
منذ 2 أشهر

FaceNet: تمثيل موحد للتمييز بين الوجوه وتجميعها

Schroff, Florian ; Kalenichenko, Dmitry ; Philbin, James
FaceNet: تمثيل موحد للتمييز بين الوجوه وتجميعها
الملخص

رغم التقدم الملحوظ الذي تحقق مؤخرًا في مجال التعرف على الوجه، فإن تنفيذ التحقق من الهوية والتعرف على الوجه بكفاءة وبمقياس كبير يشكل تحديات جدية للأساليب الحالية. في هذا البحث، نقدم نظامًا يُسمى FaceNet، يقوم بتعلم خريطة مباشرة من صور الوجوه إلى فضاء أقليدي مضغوط حيث تتوافق المسافات مع مقياس للتشابه بين الوجوه. بمجرد إنتاج هذا الفضاء، يمكن تنفيذ المهام مثل التعرف على الوجه والتحقق منه والتصنيف باستخدام تقنيات قياسية مع استخدام متجهات الميزات التي ينتجها FaceNet.طريقة عملنا تعتمد على شبكة عميقة متكررة تم تدريبها لتحسين المتجه المضمن مباشرة، بدلاً من طبقة رقبة الزجاجة الوسيطة كما هو الحال في الأساليب السابقة للتعلم العميق. لتدريب النظام، نستخدم ثلاثيات من صور وجوه متطابقة أو غير متطابقة تم ضبطها بشكل تقريبي باستخدام طريقة جديدة لتعدين الثلاثيات عبر الإنترنت. فائدة أسلوبنا هي الكفاءة التمثيلية الأكبر: نحن نحقق أفضل أداء للتعرف على الوجه باستخدام فقط 128 بايت لكل وجه.على مجموعة البيانات الشهيرة Labeled Faces in the Wild (LFW)، حقق نظامنا دقة جديدة قياسية بلغت 99.63٪. وعلى قاعدة بيانات وجوه YouTube,则实现了95.12%的准确性。与这两个数据集上公布的最佳结果相比,我们的系统将错误率降低了30%。我们还引入了谐波嵌入的概念以及谐波三元组损失,这些描述了不同网络生成的不同版本的面部嵌入,它们彼此兼容并允许直接比较。注:在最后一段中,“则实现了95.12%的准确性”和“与这两个数据集上公布的最佳结果相比,我们的系统将错误率降低了30%”这两句话为中文,可能是误操作导致。以下是正确的阿拉伯语翻译:على قاعدة بيانات وجوه YouTube (YouTube Faces DB)، حقق نظامنا دقة بلغت 95.12٪. كما أن نظامنا يقلل معدل الخطأ بنسبة 30٪ مقارنة بأفضل النتائج المنشورة على كلا المجموعتين.كما نقدم أيضًا مفهوم التضمينات التناغمية وخسارة الثلاثيات التناغمية، والتي تصف إصدارات مختلفة من تضمينات الوجوه (التي تنتجها شبكات مختلفة) التي تكون متوافقة مع بعضها البعض وتسمح بالمقارنة المباشرة بينها.

FaceNet: تمثيل موحد للتمييز بين الوجوه وتجميعها | أحدث الأوراق البحثية | HyperAI