HyperAIHyperAI
منذ 7 أيام

رسم نفس المربع المحيط مرتين؟ التعامل مع التسميات الضوضائية في كشف الكائنات باستخدام تسميات مكررة

David Tschirschwitz, Christian Benz, Morris Florek, Henrik Norderhus, Benno Stein, Volker Rodehorst
رسم نفس المربع المحيط مرتين؟ التعامل مع التسميات الضوضائية في كشف الكائنات باستخدام تسميات مكررة
الملخص

تعتمد موثوقية أنظمة التعلم الآلي المُوجَّهة على دقة وتوافر العلامات الحقيقية (ground truth labels). ومع ذلك، فإن عملية التسمية اليدوية، التي تُعرَض للخطأ، تُعدّ مصدرًا محتملًا لظهور علامات مشوّشة (noisy labels)، ما قد يعيق جدوى هذه الأنظمة من الناحية العملية. وعلى الرغم من أن التدريب باستخدام علامات مشوّشة يُعدّ مسألة ذات أهمية كبيرة، فإن موثوقية بيانات الاختبار تُعدّ أيضًا حاسمة لضمان مصداقية النتائج. إحدى الطرق الشائعة للتغلب على هذه المشكلة هي التسمية المتكررة (repeated labeling)، حيث يقوم عدة مُعلّقين بتسمية نفس المثال، ثم تُدمج علاماتهم لتقديم تقدير أفضل للعلامة الحقيقية. في هذه الورقة، نقترح خوارزمية تَحديد موضع جديدة (localization algorithm) تُطبّق بذكاء أساليب مُثبتة مسبقًا لتقدير العلامات الحقيقية في مهام كشف الكائنات (object detection) والتقسيم التمثيلي (instance segmentation). تكمن الابتكار الرئيسي في طريقة عملنا في قدرتها على تحويل مهام التحديد الموضعية والتصنيف معًا إلى مسائل تصنيف فقط، مما يمكّن من تطبيق تقنيات مثل خوارزمية التوقع-التحديث (Expectation-Maximization) أو التصويت بالأغلبية (Majority Voting). وعلى الرغم من أن تركيزنا الأساسي ينصب على تجميع العلامات الحقيقية الفريدة لبيانات الاختبار، فإن خوارزميتنا أظهرت أداءً متفوقًا أيضًا أثناء التدريب على مجموعة بيانات TexBiG، حيث تفوقت على كل من التدريب باستخدام علامات مشوّشة، والتجميع المُعدّل للعلامات باستخدام تقنية التجميع الموزون للصناديق (Weighted Boxes Fusion - WBF). تشير تجاربنا إلى أن فوائد التسمية المتكررة تظهر فقط في ظل ظروف محددة لبيانات التدريب وتكوينات التسمية. وتشير العوامل الأساسية إلى: (1) تعقيد المجموعة، (2) اتساق المُعلّقين، و(3) القيود المرتبطة بموازنة التسمية المُخصصة.

رسم نفس المربع المحيط مرتين؟ التعامل مع التسميات الضوضائية في كشف الكائنات باستخدام تسميات مكررة | أحدث الأوراق البحثية | HyperAI