
摘要
抓取是执行复杂任务的基本技能,也是智能系统的核心组成部分。针对通用的6自由度(6-DoF)抓取任务,以往多数方法直接从场景层面提取语义或几何信息,但鲜有研究考虑其在不同下游应用中的适应性,例如面向目标的抓取。为解决这一问题,我们从以抓取为中心的视角重新思考6-DoF抓取检测,提出一种通用性强的抓取框架,能够同时应对场景级抓取与面向目标的抓取任务。该框架名为FlexLoG,由一个灵活引导模块(Flexible Guidance Module)和一个局部抓取模型(Local Grasp Model)构成。其中,灵活引导模块可兼容全局(如抓取热力图)与局部(如视觉定位)引导方式,从而在多种任务中生成高质量的抓取结果。局部抓取模型专注于与物体无关的区域点,实现局部化、精细化的抓取预测。实验结果表明,该框架在GraspNet-1Billion数据集的未见划分上分别实现了超过18%和23%的性能提升。此外,在三种不同真实场景下的机器人测试中,抓取成功率高达95%。