HyperAIHyperAI
منذ 11 أيام

PseCo: التسمية الوهمية والتدريب على الاتساق للكشف عن الكائنات شبه المراقبة

Gang Li, Xiang Li, Yujie Wang, Yichao Wu, Ding Liang, Shanshan Zhang
PseCo: التسمية الوهمية والتدريب على الاتساق للكشف عن الكائنات شبه المراقبة
الملخص

في هذه الورقة، نتعمق في تقنيتين رئيسيتين في الكشف عن الكائنات شبه المُعلَّمة (SSOD)، وهما التسمية الوهمية (pseudo labeling) والتدريب على التماسك (consistency training). نلاحظ أن هاتين التقنيتين تتجاهلان حاليًا بعض الخصائص المهمة للكشف عن الكائنات، مما يعيق التعلم الفعّال على البيانات غير المُعلَّمة. بشكل خاص، فيما يتعلق بالتسمية الوهمية، تركز الدراسات الحالية فقط على درجة التصنيف، لكنها تفشل في ضمان دقة تحديد الموضع للصناديق الوهمية؛ أما في التدريب على التماسك، فإن التدريب العشوائي المُعدّل للحجم (random-resize training) الذي يُستخدم على نطاق واسع يهتم فقط بالتماسك على مستوى التسميات، ويتجاهل التماسك على مستوى الميزات، والذي يلعب دورًا مهمًا في ضمان التماسك بالنسبة للتغيرات في الحجم. لمعالجة المشكلات الناتجة عن الصناديق الوهمية الضوضائية، نصمم طريقة تُسمى التعلم على الصناديق الوهمية الضوضائية (Noisy Pseudo box Learning - NPL)، التي تتضمن آلية تعيين التسميات الموجهة بالتنبؤ (Prediction-guided Label Assignment - PLA) وآلية التصويت على التماسك للاقتراحات الإيجابية (Positive-proposal Consistency Voting - PCV). تعتمد PLA على نتائج تنبؤات النموذج لتخصيص التسميات، مما يجعلها مقاومة حتى للصناديق الوهمية الخشنة؛ في حين يستخدم PCV اتساق التصحيح للاقتراحات الإيجابية لتقييم جودة تحديد الموضع للصناديق الوهمية. علاوةً على ذلك، في سياق التدريب على التماسك، نقترح طريقة التعلم متعدد الرؤى القائم على التماسك بالنسبة للتغيرات في الحجم (Multi-view Scale-invariant Learning - MSL)، التي تدمج آليات التماسك على مستوى التسميات وعلى مستوى الميزات، حيث يتم تحقيق التماسك على مستوى الميزات من خلال محاذاة هياكل الميزات المنقولة بين صورتين تحتويان على محتوى متماثل لكن بمقاييس مختلفة. على معيار COCO، يتفوّق أسلوبنا، المُسمّى PSEudo labeling and COnsistency training (PseCo)، على الأسلوب المُتفوّق الحالي (Soft Teacher) بـ 2.0 و1.8 و2.0 نقطة على التوالي عند نسب تسمية 1% و5% و10%. كما يُحسّن بشكل كبير كفاءة التعلم في الكشف عن الكائنات شبه المُعلَّمة، إذ يُقلّل PseCo من زمن التدريب إلى النصف مقارنةً بالأسلوب الحالي، مع تحقيق أداءً أفضل. يُمكن الوصول إلى الكود من خلال الرابط: https://github.com/ligang-cs/PseCo.

PseCo: التسمية الوهمية والتدريب على الاتساق للكشف عن الكائنات شبه المراقبة | أحدث الأوراق البحثية | HyperAI