HyperAIHyperAI
منذ 7 أيام

الكشف عن الكائنات المتعددة والتحمّل المتعدد في العالم الحقيقي

{Fu-Jen Chu, Ruinian Xu and Patricio A. Vela}
الكشف عن الكائنات المتعددة والتحمّل المتعدد في العالم الحقيقي
الملخص

تم اقتراح بنية تعلم عميق لتنبؤ مواقع الإمساك القابِلَة للروبوتات في المهام التلاعبية. وتعمل هذه البنية على معالجة الحالات التي لا يُرى فيها أي كائن، أو كائن واحد، أو أكثر من كائن واحد. وبتعريف مشكلة التعلّم كتصنيف باستخدام منافسة الفرضية الصفرية بدلًا من الانحدار، تتنبأ الشبكة العصبية العميقة التي تتلقى إدخالًا من صور باللونين الأحمر والأخضر والأزرق والعمق (RGB-D) بمراتب إمساك متعددة لجسم واحد أو لأجسام متعددة في عملية واحدة. وقد تفوقت هذه الطريقة على الطرق المتطورة حديثًا على مجموعة بيانات كورنيل، حيث بلغت دقة التصنيف 96.0% و96.1% على التوالي في تقسيمي الصور والكائنات. وعند تقييم الأداء على مجموعة بيانات متعددة الأجسام، أظهرت البنية قدرة عامة ممتازة على التعميم. وحققت تجارب الإمساك معدلات توصيف موضع الإمساك بنسبة 96.0%، ونسبة نجاح الإمساك بنسبة 89.0% على مجموعة اختبار من الأدوات المنزلية. كما أن المعالجة في الزمن الحقيقي تستغرق أقل من 0.25 ثانية من لحظة استقبال الصورة حتى إعداد الخطة.

الكشف عن الكائنات المتعددة والتحمّل المتعدد في العالم الحقيقي | أحدث الأوراق البحثية | HyperAI