HyperAIHyperAI
منذ شهر واحد

iSAID: مجموعة بيانات كبيرة لتمييز النماذج في الصور الجوية

Syed Waqas Zamir; Aditya Arora; Akshita Gupta; Salman Khan; Guolei Sun; Fahad Shahbaz Khan; Fan Zhu; Ling Shao; Gui-Song Xia; Xiang Bai
iSAID: مجموعة بيانات كبيرة لتمييز النماذج في الصور الجوية
الملخص

البيانات الحالية لرؤية الأرض إما مناسبة للتقسيم الدلالي أو كشف الأشياء. في هذا العمل، نقدم أول مجموعة بيانات مرجعية للتقسيم الفردي في الصور الجوية التي تجمع بين مهمة كشف الأشياء على مستوى الفرد وتقسيم البكسلات على المستوى الدقيق. بالمقارنة مع التقسيم الفردي للمشاهد الطبيعية، فإن الصور الجوية تقدم تحديات فريدة مثل عدد كبير جداً من الحالات في كل صورة، وتغيرات كبيرة في حجم الأشياء، ووفرة الأشياء الصغيرة جداً. مجموعة بياناتنا الكبيرة والمُشَاهَدَة بكثافة للتقسيم الفردي في الصور الجوية (iSAID) تأتي مع 655,451 حالة شكلية للأجسام لـ 15 فئة عبر 2,806 صور عالية الدقة. هذه التحديدات الدقيقة لكل بكسل لكل حالة ضرورية لتحقيق تحديد دقيق مهم لتحليل المشهد بتفصيل. بالمقارنة مع المجموعات البيانات القائمة على الصور الجوية ذات الحجم الصغير والمخصصة للتقسيم الفردي، تحتوي iSAID على 15 ضعف عدد فئات الأجسام و5 أضعاف عدد الحالات. قمنا بتقييم مجموعتنا البيانات باستخدام طريقتين شهيرتين للتقسيم الفردي للمشاهد الطبيعية وهما Mask R-CNN وPANet. في تجاربنا، أظهرنا أن التطبيق المباشر لهذه النماذج الجاهزة (off-the-shelf) من Mask R-CNN وPANet على الصور الجوية يوفر نتائج تقسيم فردي غير مثلى، مما يتطلب حلولًا متخصصة من المجتمع البحثي. يمكن الوصول إلى المجموعة البيانات بشكل عام من الرابط التالي: https://captain-whu.github.io/iSAID/index.html

iSAID: مجموعة بيانات كبيرة لتمييز النماذج في الصور الجوية | أحدث الأوراق البحثية | HyperAI