HyperAIHyperAI
منذ 11 أيام

نظر أعمق في الكشف عن الكائنات المشتركة للبصيرة

{ Ming-Ming Cheng, Huazhu Fu, Dingwen Zhang, Ge-Peng Ji, Zheng Lin, Deng-Ping Fan}
نظر أعمق في الكشف عن الكائنات المشتركة للبصيرة
الملخص

كشف الكائنات المميزة المشتركة (CoSOD) هو فرع حديث وناشئ يشهد نموًا سريعًا في مجال كشف الكائنات المميزة (SOD)، ويهدف إلى اكتشاف الكائنات المميزة المشتركة في صور متعددة. ومع ذلك، فإن المجموعات الحالية لبيانات CoSOD تعاني غالبًا من انحياز كبير في البيانات، حيث يُفترض أن كل مجموعة من الصور تحتوي على كائنات مميزة ذات مظهر بصري مشابه. يؤدي هذا الانحياز إلى تقليل فعالية النماذج المدربة على هذه المجموعات في البيئات الواقعية، حيث تكون التشابهات عادةً على المستوى المفاهيمي أو المفهومي بدلًا من المظهر البصري. لمعالجة هذه المشكلة، قمنا أولًا بجمع مجموعة بيانات جديدة عالية الجودة تُسمى CoSOD3k، والتي تتضمن 3316 صورة مقسمة إلى 160 مجموعة، مع تسميات متعددة المستويات، أي على مستويات الفئة، والمستطيل المحيط (Bounding Box)، والكائن، والمستوى الفردي (instance). تمثل CoSOD3k قفزة كبيرة من حيث التنوّع والصعوبة والقابلية للتوسع، مما يُعد بمنفعة كبيرة للمهام المرتبطة بالرؤية الحاسوبية. بالإضافة إلى ذلك، قمنا بملخص شامل لـ 34 خوارزمية متطورة، وتمت مقارنة 19 منها على أربع مجموعات بيانات موجودة لـ CoSOD (MSRC، iCoSeg، Image Pair، وCoSal2015) وكذلك على مجموعة البيانات الجديدة CoSOD3k، باستخدام ما مجموعه 61000 صورة (أكبر حجم ممكن)، مع تقديم تحليل أداء على مستوى المجموعات. وأخيرًا، نناقش التحديات والاتجاهات المستقبلية لـ CoSOD. إن دراستنا ستسهم بشكل كبير في دفع عجلة النمو داخل مجتمع CoSOD. يُتاح أداة المقارنة (Benchmark toolbox) والنتائج على صفحة المشروع الخاصة بنا.

نظر أعمق في الكشف عن الكائنات المشتركة للبصيرة | أحدث الأوراق البحثية | HyperAI