HyperAIHyperAI
منذ 17 أيام

PADS: عينة مُعدَّلة بالسياسة لتعلم التشابه البصري

Karsten Roth, Timo Milbich, Björn Ommer
PADS: عينة مُعدَّلة بالسياسة لتعلم التشابه البصري
الملخص

يتطلب تعلُّم التشابه البصري تعلُّم العلاقات، عادةً بين مجموعات مكوَّنة من ثلاث صور. وعلى الرغم من أن نُهج المجموعات الثلاثية (triplet approaches) قوية، إلا أن تعقيد الحسابات المرتبط بها يحدّ في الغالب من التدريب إلى مجموعة جزئية فقط من جميع المجموعات الثلاثية الممكنة للتدريب. وبالتالي، فإن استراتيجيات العينة التي تُحدِّد متى تُستخدم أي عينة تدريبية خلال عملية التعلُّم أصبحت أمرًا بالغ الأهمية. في الوقت الحالي، تُعتبر الاستراتيجيات الثابتة أو الاستراتيجيات التدريبية التدريجية (curriculum sampling strategies) هي النموذج السائد، وهي مُعرَّفة مسبقًا قبل بدء التدريب. لكن المشكلة تتطلب في الحقيقة عملية عينة تُعدِّل بناءً على الحالة الفعلية لتمثيل التشابه أثناء التدريب. ولذلك، نستخدم التعلُّم المعزَّز (reinforcement learning)، ونُسَمِّي شبكة "المُدرِّس" بتعديل توزيع العينة بناءً على الحالة الحالية لشبكة "المُتعلِّم"، والتي تمثل التشابه البصري. أظهرت التجارب على مجموعات بيانات معيارية باستخدام خسائر قياسية قائمة على المجموعات الثلاثية أن استراتيجية العينة التكيفية التي نقترحها تتفوّق بشكل ملحوظ على الاستراتيجيات الثابتة. علاوةً على ذلك، وعلى الرغم من أن استراتيجيتنا التكيفية تُطبَّق فقط على أطر تعلُّم المجموعات الثلاثية الأساسية، إلا أننا نحقّق نتائج تنافسية مع أفضل النماذج الحالية التي تعتمد على إشارات تعلُّم إضافية متنوعة أو هياكل تجميع قوية. يمكن الوصول إلى الكود عبر الرابط: https://github.com/Confusezius/CVPR2020_PADS.

PADS: عينة مُعدَّلة بالسياسة لتعلم التشابه البصري | أحدث الأوراق البحثية | HyperAI