7 个月前

卷积神经网络

计算机视觉

计算机视觉

Aryaman Gupta Kalpit Thakkar Vineet Gandhi P J Narayanan

摘要

单目头部姿态估计需要学习一个模型，该模型能够从输入的人脸图像中计算出姿态的内在欧拉角（偏航角、俯仰角、滚转角）。为野外环境中的图像标注真实的头部姿态角度是一项困难的任务，通常需要使用特定的拟合程序（这些程序只能提供粗略且近似的标注）。这突显了对能够在受控环境中训练并在野外图像上泛化的算法的需求（这些图像具有不同的面部外观和光照条件）。当前大多数直接在输入图像上学习回归函数的深度学习方法都无法实现这一目标。为此，我们提出使用更高层次的表示来通过深度学习架构回归头部姿态。具体而言，我们利用五个面部关键点（左耳、右耳、左眼、右眼和鼻子）上的二维软定位热图作为不确定性图，并将其传递给卷积神经网络以回归头部姿态。我们在两个具有挑战性的基准数据集BIWI和AFLW上展示了头部姿态估计的结果，我们的方法在这两个数据集上均超过了现有最先进的技术。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

7 个月前

卷积神经网络

计算机视觉

计算机视觉

Aryaman Gupta Kalpit Thakkar Vineet Gandhi P J Narayanan

摘要

单目头部姿态估计需要学习一个模型，该模型能够从输入的人脸图像中计算出姿态的内在欧拉角（偏航角、俯仰角、滚转角）。为野外环境中的图像标注真实的头部姿态角度是一项困难的任务，通常需要使用特定的拟合程序（这些程序只能提供粗略且近似的标注）。这突显了对能够在受控环境中训练并在野外图像上泛化的算法的需求（这些图像具有不同的面部外观和光照条件）。当前大多数直接在输入图像上学习回归函数的深度学习方法都无法实现这一目标。为此，我们提出使用更高层次的表示来通过深度学习架构回归头部姿态。具体而言，我们利用五个面部关键点（左耳、右耳、左眼、右眼和鼻子）上的二维软定位热图作为不确定性图，并将其传递给卷积神经网络以回归头部姿态。我们在两个具有挑战性的基准数据集BIWI和AFLW上展示了头部姿态估计的结果，我们的方法在这两个数据集上均超过了现有最先进的技术。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供