HyperAIHyperAI
منذ 2 أشهر

التكيف النمطي للمنهاج لتقسيم الدلالة للمشاهد الحضرية

Yang Zhang; Philip David; Boqing Gong
التكيف النمطي للمنهاج لتقسيم الدلالة للمشاهد الحضرية
الملخص

خلال النصف عقد الماضي، حققت شبكات العصب المتكررة (CNNs) نجاحًا كبيرًا في التجزئة الدلالية، وهي إحدى المهام الأساسية في العديد من التطبيقات مثل القيادة الذاتية. ومع ذلك، يتطلب تدريب هذه الشبكات كمية كبيرة من البيانات، والتي تكون صعبة في جمعها ومجهدة في تسميتها. أتاحت التطورات الحديثة في الرسوميات الحاسوبية إمكانية تدريب شبكات العصب المتكررة على صور مركبة واقعية مع تسميات مولدة بواسطة الحاسوب. ومع ذلك، فإن الاختلاف بين المجالات بين الصور الحقيقية والبيانات المركبة يقلل من أداء النماذج. لذلك، نقترح نهجًا للتعلم على غرار المناهج التعليمية لتصغير الفجوة بين المجالات في التجزئة الدلالية للمناظر الحضرية. يحل هذا النهج التكيفي بين المجالات المهام السهلة أولاً لاستنتاج الخصائص اللازمة حول المجال المستهدف؛ بخاصة، يكون أول مهمة هي تعلم توزيعات العلامات العالمية عبر الصور وتوزيعات محلية عبر البكسلات الفائقة للنقاط المرجعية. هذه المهام سهلة التقدير لأن صور المناظر الحضرية لها خصائص قوية فريدة (مثل حجم وعلاقات المواقع المكانية للمباني والشوارع والسيارات وما إلى ذلك). ثم نقوم بتدريب شبكة التجزئة بينما ننظم توقعاتها في المجال المستهدف لتتبع تلك الخصائص المستنتجة. وفي التجارب، أثبتت طريقتنا الأفضلية على القواعد الأساسية في مجموعتين من البيانات وشبكتين أساسيتين. كما نقدم دراسات تقليص واسعة حول منهجيتنا.

التكيف النمطي للمنهاج لتقسيم الدلالة للمشاهد الحضرية | أحدث الأوراق البحثية | HyperAI