
摘要
近期的研究表明,使用三维卷积网络在三维物体识别中取得了良好的识别效果。本文进一步指出,物体的方向在三维识别中起着重要作用。具体而言,我们认为旋转会使得物体在网络中产生不同的特征。因此,我们将类别级别的分类任务视为一个多任务问题,在该问题中,网络不仅需要预测物体的类别标签,还需要同时预测物体的姿态。我们展示了这种方法在分类结果上带来了显著的改进。我们在多个数据集上测试了所提出的架构,这些数据集代表了各种三维数据源:激光雷达(LiDAR)数据、计算机辅助设计(CAD)模型和RGB-D图像。我们报告了在分类任务上的最新成果,并且在三维检测任务上相比基线方法实现了精度和速度的显著提升。