HyperAIHyperAI
منذ 11 أيام

FTNet: شبكة تحويل الميزات لتقسيم الدلالة للصور الحرارية

{Srijith Rajeev and Sos S Agaian, Shreyas Kamath K.M, Karen Panetta}
الملخص

التصوير الحراري هو عملية تستخدم الإشعاع تحت الأحمر والطاقة الحرارية لجمع معلومات حول الأجسام. وهو يتفوق على التصوير المرئي بفضل قدرته على العمل في الظلام وتقبّل التغيرات في الإضاءة. بالإضافة إلى ذلك، يمتلك القدرة على اختراق الدخان، والغبار، والضباب، والجزيئات المعلقة، وهي عوامل حاسمة تعيق تطبيقات التصوير المرئي، بما في ذلك التجزئة الدلالية. وللأسف، فإن الطرق الحديثة المتطورة لتحليل التجزئة الدلالية للصور (i) تركز بشكل رئيسي على صور الطيف المرئي، والتي لا تلتقط بفعالية السياق المتعلق بالبكسلات المقابلة، وخاصة التفاصيل الحادة في الصور الحرارية، و(ii) تقبل تنازلاً بين الدقة العالية والسرعة المنخفضة، أو العكس. هنا، تم اقتراح بنية جديدة قابلة للتدريب من الطرف إلى الطرف لشبكة عصبية تلافيفية، تُعرف باسم الشبكة العرضية للسمات (FTNet)، لحل المشكلات المذكورة أعلاه. تُمكّن FTNet من التقاط وتحسين تمثيل السمات على مقاييس متعددة، مما يعزز القدرة على معالجة الصور عالية الدقة وإنتاج نتائج عالية الجودة بتكلفة حسابية منخفضة. تم إجراء تجارب حاسوبية واسعة النطاق على مجموعات بيانات معيارية حرارية مفتوحة المصدر، تشمل SODA وMFNet وSCUT-Seg، لإثبات فعالية الشبكة المقترحة مقارنةً بالطرق المتطورة الحالية. تشمل هذه المقارنة جوانب متعددة، منها الدقة الكمية وسرعة الأداء للطرق المختلفة. يتوفر الكود المصدري على الرابط التالي: https://github.com/shreyaskamathkm/FTNet.

FTNet: شبكة تحويل الميزات لتقسيم الدلالة للصور الحرارية | أحدث الأوراق البحثية | HyperAI