8 个月前

计算机视觉

卷积神经网络

计算机视觉

Purbayan Kar Vishal Chudasama Naoyuki Onoe Pankaj Wasnik Vineeth Balasubramanian

摘要

深度学习方法在面部关键点检测（FLD）任务中取得了显著的性能提升。然而，在具有挑战性的环境中，如头部姿态变化、夸张表情或不均匀光照条件下，检测关键点仍然是一项难题，这主要是由于高变异性及样本不足所致。这种不足可以归因于模型无法从输入图像中有效获取适当的脸部结构信息。为了解决这一问题，我们提出了一种专门为FLD任务设计的新型图像增强技术，以提高模型对脸部结构的理解能力。为了有效利用新提出的增强技术，我们采用基于Siamese架构的训练机制，并结合基于深度规范相关分析（DCCA）的损失函数，实现从输入图像的两个不同视角中集体学习高层次特征表示。此外，我们还采用了Transformer + CNN架构的网络，并引入了自定义沙漏模块作为Siamese框架的强大骨干。大量实验表明，我们的方法在多个基准数据集上优于多种最先进的方法。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

计算机视觉

卷积神经网络

计算机视觉

Purbayan Kar Vishal Chudasama Naoyuki Onoe Pankaj Wasnik Vineeth Balasubramanian

摘要

深度学习方法在面部关键点检测（FLD）任务中取得了显著的性能提升。然而，在具有挑战性的环境中，如头部姿态变化、夸张表情或不均匀光照条件下，检测关键点仍然是一项难题，这主要是由于高变异性及样本不足所致。这种不足可以归因于模型无法从输入图像中有效获取适当的脸部结构信息。为了解决这一问题，我们提出了一种专门为FLD任务设计的新型图像增强技术，以提高模型对脸部结构的理解能力。为了有效利用新提出的增强技术，我们采用基于Siamese架构的训练机制，并结合基于深度规范相关分析（DCCA）的损失函数，实现从输入图像的两个不同视角中集体学习高层次特征表示。此外，我们还采用了Transformer + CNN架构的网络，并引入了自定义沙漏模块作为Siamese框架的强大骨干。大量实验表明，我们的方法在多个基准数据集上优于多种最先进的方法。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供