6 个月前

多模态表征

计算机视觉

计算机视觉

Xu Yan Heshen Zhan Chaoda Zheng Jiantao Gao Ruimao Zhang Shuguang Cui Zhen Li

摘要

尽管近期点云分析取得了令人瞩目的进展，但单一模态的表征学习范式逐渐面临瓶颈。本文致力于通过充分挖掘图像所蕴含的丰富外观信息（如纹理、颜色和明暗等），构建更具判别性的三维点云表征。具体而言，本文提出一种简单而高效的点云跨模态训练策略——PointCMT（Point Cloud Cross-Modality Training），该方法利用视图图像（即三维物体的渲染或投影二维图像）来增强点云分析性能。为有效从视图图像中获取辅助知识，我们设计了一种教师-学生框架，并将跨模态学习建模为知识蒸馏问题。PointCMT通过新颖的特征与分类器增强准则，有效消除了不同模态间的分布差异，并避免了潜在的负迁移问题。值得注意的是，PointCMT在不修改网络架构的前提下，显著提升了仅依赖点云的表征能力。大量实验验证了其优越性：在多个数据集上，结合性能优异的骨干网络（如PointNet++和PointMLP），PointCMT在ModelNet40和ScanObjectNN两个基准测试中分别取得了94.4%和86.7%的准确率，达到当前最优水平。代码将开源，地址为：https://github.com/ZhanHeshen/PointCMT。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

多模态表征

计算机视觉

计算机视觉

Xu Yan Heshen Zhan Chaoda Zheng Jiantao Gao Ruimao Zhang Shuguang Cui Zhen Li

摘要

尽管近期点云分析取得了令人瞩目的进展，但单一模态的表征学习范式逐渐面临瓶颈。本文致力于通过充分挖掘图像所蕴含的丰富外观信息（如纹理、颜色和明暗等），构建更具判别性的三维点云表征。具体而言，本文提出一种简单而高效的点云跨模态训练策略——PointCMT（Point Cloud Cross-Modality Training），该方法利用视图图像（即三维物体的渲染或投影二维图像）来增强点云分析性能。为有效从视图图像中获取辅助知识，我们设计了一种教师-学生框架，并将跨模态学习建模为知识蒸馏问题。PointCMT通过新颖的特征与分类器增强准则，有效消除了不同模态间的分布差异，并避免了潜在的负迁移问题。值得注意的是，PointCMT在不修改网络架构的前提下，显著提升了仅依赖点云的表征能力。大量实验验证了其优越性：在多个数据集上，结合性能优异的骨干网络（如PointNet++和PointMLP），PointCMT在ModelNet40和ScanObjectNN两个基准测试中分别取得了94.4%和86.7%的准确率，达到当前最优水平。代码将开源，地址为：https://github.com/ZhanHeshen/PointCMT。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供