اكتشاف القبضات في الفوضى للكشف السريع والدقيق عن القبضات

إن الكشف الفعّال والموثوق عن وضعية الإمساك يُعد أمرًا بالغ الأهمية لمهام التلاعب الروبوتي. بالنسبة للإمساك العام بست درجات حرية (6 DoF)، تُعامل الطرق التقليدية جميع النقاط في المشهد بشكل متساوٍ، وغالبًا ما تستخدم عينة متجانسة لاختيار المرشحين للإمساك. ومع ذلك، نكتشف أن تجاهل مكان الإمساك يُضر بشكل كبير بسرعة ودقة الطرق الحالية للكشف عن وضعية الإمساك. في هذا البحث، نقترح مفهوم "جراسبنيس" (graspness)، وهو مؤشر جودة يعتمد على مؤشرات هندسية تميّز المناطق القابلة للإمساك في المشاهد المزدحمة. كما نُقدّم طريقة بحث متقدمة (look-ahead searching) لقياس جراسبنيس، وتُثبت النتائج الإحصائية منطقية المنهجية التي اقترحناها. وللكشف السريع عن جراسبنيس في التطبيقات العملية، طوّرنا شبكة عصبية تُسمى "نموذج جراسبنيس المتسلسل" (cascaded graspness model) لتقليد عملية البحث. وقد أثبتت التجارب الواسعة استقرار النموذج وعامة استخدامه وفعاليته، ما يمكّنه من العمل كوحدة قابلة للتركيب والتشغيل السريع مع مختلف الطرق. وقد لوحظ تحسن كبير في الدقة لعدة طرق سابقة بعد دمج نموذج جراسبنيس. علاوةً على ذلك، طوّرنا GSNet، وهي شبكة امتداد كامل (end-to-end) تدمج نموذج جراسبنيس لتصفية مبكرة للتنبؤات منخفضة الجودة. وأظهرت التجارب على معيار واسع النطاق، GraspNet-1Billion، أن طريقةنا تتفوّق على الطرق السابقة بشكل كبير (بفارق أكثر من 30 نقطة AP) وتحقق سرعة عالية في الاستدلال. وقد تم دمج مكتبة GSNet في أي غراسب (AnyGrasp)، والتي يمكن الوصول إليها عبر الرابط: https://github.com/graspnet/anygrasp_sdk.