
摘要
我们提出了一种基于卷积神经网络的精确实时机器人抓取检测方法。该网络通过单阶段回归直接预测可抓取的边界框,而无需使用传统的滑动窗口或区域提议技术。模型在性能上比现有最先进方法高出14个百分点,并且在GPU上可以达到每秒13帧的运行速度。我们的网络能够同时进行分类,从而在一个步骤中识别物体并找到一个合适的抓取矩形。对这一模型的改进版本通过使用局部约束预测机制来实现每个物体的多点抓取预测。这种局部约束模型的表现显著提升,尤其是在那些可以通过多种方式被抓取的物体上。
我们提出了一种基于卷积神经网络的精确实时机器人抓取检测方法。该网络通过单阶段回归直接预测可抓取的边界框,而无需使用传统的滑动窗口或区域提议技术。模型在性能上比现有最先进方法高出14个百分点,并且在GPU上可以达到每秒13帧的运行速度。我们的网络能够同时进行分类,从而在一个步骤中识别物体并找到一个合适的抓取矩形。对这一模型的改进版本通过使用局部约束预测机制来实现每个物体的多点抓取预测。这种局部约束模型的表现显著提升,尤其是在那些可以通过多种方式被抓取的物体上。