HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 4 أشهر

التفريق متعدد الوسائط للمواد

{Ko Nishino Shohei Nobuhara Ryosuke Wakaki Yupeng Liang}

التفريق متعدد الوسائط للمواد

الملخص

التعرف على المواد من خلال مظهرها البصري أمر ضروري لمهام رؤية الحاسوب، وخاصة تلك التي تتضمن تفاعلًا مع العالم الحقيقي. لا يزال التصنيف الدقيق للمواد، أي التعرف الكثيف على مستوى كل بكسل، يمثل تحديًا كبيرًا، لأن المواد لا تُظهر توقيعات بصرية واضحة في مظهرها العادي المُعَرَّف بـ RGB. ومع ذلك، فإن المواد المختلفة تؤدي إلى سلوكيات كهروضوئية مختلفة، والتي يمكن غالبًا التقاطها باستخدام وسائط تصوير غير RGB. نحن نحقق التصنيف المتعدد الوسائط للمواد باستخدام صور RGB، وصور الاستقطاب، والأشعة تحت الحمراء القريبة. ونقدم مجموعة بيانات تُسمى MCubeS (من MultiModal Material Segmentation)، التي تتضمن 500 مجموعة من الصور المتعددة الوسائط، تُصوِّر 42 مشهدًا شارعيًا. تم ترميز التصنيف الدقيق للمواد، وكذلك التصنيف الدلالي، لكل صورة وجميع البكسلات. كما نُطوّر شبكة عصبية عميقة جديدة تُسمى MCubeSNet، التي تتعلم التركيز على أزواج الوسائط الأكثر إفادة لكل فئة من فئات المواد، من خلال طبقة اختيار مرشحات موجهة بالمنطقة (RGFS) التي تم تطويرها حديثًا. ونستخدم التصنيف الدلالي كمعلومة أولية لتوجيه عملية اختيار المرشحات. إلى حد علمنا، فإن عملنا هو الدراسة الشاملة الأولى حول التصنيف الحقيقي المتعدد الوسائط للمواد. نعتقد أن هذا العمل يفتح آفاقًا جديدة لاستخدام معلومات المواد في التطبيقات الحساسة للأمان.

المعايير القياسية

معيار قياسيالمنهجيةالمقاييس
semantic-segmentation-on-mcubesMCubeSNet (RGB-A-D-N)
mIoU: 42.86%
semantic-segmentation-on-uplightMCubeSNet (RGB-AoLP)
mIoU: 82.64
semantic-segmentation-on-uplightMCubeSNet (RGB-DoLP)
mIoU: 80.80

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
التفريق متعدد الوسائط للمواد | الأوراق البحثية | HyperAI