HyperAIHyperAI
منذ 7 أيام

GraspNet-1Billion: معيار واسع النطاق للإمساك العام بالكائنات

{ Cewu Lu, Minghao Gou, Chenxi Wang, Hao-Shu Fang}
GraspNet-1Billion: معيار واسع النطاق للإمساك العام بالكائنات
الملخص

الإمساك بالكائنات يُعد أمرًا بالغ الأهمية لعدة تطبيقات، وهو أيضًا مشكلة صعبة في مجال الرؤية الحاسوبية. ومع ذلك، تواجه الأبحاث الحالية في المشاهد المزدحمة مشكلات تتعلق بنقص بيانات التدريب وغياب معايير تقييم ملائمة. في هذا العمل، نقدّم مجموعة بيانات كبيرة الحجم للكشف عن وضعية الإمساك، مصحوبة بنظام تقييم موحد. تحتوي مجموعتنا على 97,280 صورة RGB-D، تضم أكثر من مليار وضعية إمساك. علاوةً على ذلك، يُقدّم نظام التقييم لدينا تقارير مباشرة حول نجاح عملية الإمساك من خلال حسابات تحليلية، مما يمكّن من تقييم أي نوع من وضعيات الإمساك دون الحاجة إلى وضع العلامات اليدوية على جميع الحالات الحقيقية (ground-truth) بشكل مُفصّل. بالإضافة إلى ذلك، نقترح شبكة تنبؤ بوضعية الإمساك من النهاية إلى النهاية (end-to-end) تُدخل فيها بيانات السحابة النقطية (point cloud)، حيث نتعلم اتجاه الاقتراب وبارامترات التشغيل بطريقة منفصلة (decoupled). كما تم تصميم مجال ارتباط جديد للإمساك (grasp affinity field) لتحسين موثوقية الإمساك. قمنا بإجراء تجارب واسعة النطاق تُظهر أن مجموعتنا ونظام التقييم يمكنهما التوافق الجيد مع التجارب الواقعية، وأن الشبكة المقترحة تحقق أفضل أداء ممكن حتى الآن. تتوفر مجموعتنا، وشفرة المصدر، والنماذج بشكل عام عبر الإنترنت على الموقع: www.graspnet.net.

GraspNet-1Billion: معيار واسع النطاق للإمساك العام بالكائنات | أحدث الأوراق البحثية | HyperAI