HyperAIHyperAI

Command Palette

Search for a command to run...

تجميع ودمج: التعرف على الوجه مع مجموعة تحقيق كبيرة

Minchul Kim Feng Liu Anil Jain Xiaoming Liu

الملخص

تلعب الدمج المميزات دورًا حاسمًا في التعرف على الوجه دون قيود، حيث تتكون المدخلات (الاستقصاءات) من مجموعة من الصور ذات الجودة المنخفضة التي تختلف جودتها الفردية. أدت التطورات في وحدات الانتباه والوحدات المتكررة إلى تحسين دمج الميزات بحيث يمكنها نمذجة العلاقات بين الصور في مجموعة المدخلات. ومع ذلك، فإن آليات الانتباه لا يمكنها التوسع إلى قيم كبيرة لـ NNN بسبب تعقيدها التربيعي، في حين تعاني الوحدات المتكررة من الحساسية تجاه ترتيب المدخلات. نقترح نموذجًا ثنائي المرحلة لدمج الميزات يُسمى "تجميع ودمج"، والذي يمكنه التوسع إلى قيم كبيرة لـ NNN مع الحفاظ على القدرة على إجراء استنتاج تسلسلي مع الحفاظ على التماثل تجاه الترتيب. بشكل خاص، تتضمن المرحلة الأولى "تجميع" تعيينًا خطيًا لـ NNN مدخلات إلى MMM مركزًا تجميعيًا عالميًا، بينما تتمثل المرحلة الثانية "دمج" في دمج الميزات المجمعة عبر MMM مجموعة. تؤدي الميزات المجمعة دورًا جوهريًا عند وجود مدخلات تسلسلية، حيث يمكنها أن تُعد ملخصًا للميزات السابقة. وباستغلال خاصية عدم التأثر بالترتيب في عملية التقدير التدريجي، نصمم قاعدة تحديث تحقق من التماثل تجاه ترتيب الحزم، مما يضمن أن لا تتناقص مساهمة الصور المبكرة في التسلسل مع زيادة عدد الخطوات الزمنية. أظهرت التجارب على مجموعتي بيانات المعيار IJB-B وIJB-S تفوق النموذج ثنائي المرحلة المقترح في التعرف على الوجه دون قيود. يمكن الوصول إلى الشفرة النموذجية والنموذج المُدرّب مسبقًا من خلال الرابط: https://github.com/mk-minchul/caface


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
تجميع ودمج: التعرف على الوجه مع مجموعة تحقيق كبيرة | مستندات | HyperAI