إعادة التفكير في كشف الإمساك 6-د، إطار عمل مرن للكشف عن الإمساك عالي الجودة

التقاط الروبوتات مهارة أساسية للأنشطة المعقدة، وتعتبر حجر الزاوية في الذكاء. بالنسبة للالتقاط العام في 6 درجات من الحرية (6-DoF)، فإن معظم الطرق السابقة تستخلص مباشرة معلومات دلالية أو هندسية على مستوى المشهد، بينما يهتم عدد قليل منها بملاءمة هذه الطرق لتطبيقات لاحقة متنوعة، مثل التقاط الأهداف المحددة. ولحل هذه المشكلة، نعيد التفكير في كشف التقاط 6-DoF من منظور مركّز حول التقاط اليد، ونُقدّم إطارًا مرنًا قادرًا على التعامل مع كل من التقاط المشهد والتقاط الأهداف. يتكون إطارنا، FlexLoG، من وحدة توجيه مرنة ونموذج تقاطع محلي. وبشكل خاص، تتوافق وحدة التوجيه المرنة مع التوجيهات العالمية (مثل خريطة حرارة التقاط اليد) والمحليّة (مثل التأصيل البصري)، مما يمكّن من إنتاج تقاطعات عالية الجودة في مختلف المهام. أما نموذج التقاط المنطقة المحلي، فيركّز على نقاط إقليمية غير مُتّصلة بالكائن، ويتوقع التقاطات محليًا وبتركيز عالٍ. أظهرت نتائج التجارب تحسنًا بنسبة تزيد عن 18% و23% على مقاطع غير معروفة من مجموعة بيانات GraspNet-1Billion. علاوة على ذلك، حققت اختبارات الروبوت في العالم الحقيقي في ثلاث بيئات مختلفة معدل نجاح بلغ 95%.