8 个月前

多任务学习

计算机视觉

Paritosh Parmar Brendan Tran Morris

摘要

在动作质量评估（AQA）任务中，利用对动作及其质量的描述是否可以提高性能？当前的AQA和技能评估方法建议学习仅服务于一个任务的特征——估计最终得分。本文提出了一种学习时空特征的方法，这些特征可以解释三个相关任务：细粒度动作识别、评论生成以及估计AQA得分。为了评估我们的方法，我们收集了一个新的多任务AQA数据集，这是迄今为止最大的数据集，包含1412个跳水样本（https://github.com/ParitoshParmar/MTL-AQA）。我们展示了使用两种不同架构——C3D-AVG和MSCADC时，我们的多任务学习（MTL）方法优于单任务学习（STL）方法。C3D-AVG-MTL方法达到了新的最先进水平，等级相关系数为90.44%。通过详细的实验表明，与单任务学习相比，多任务学习提供了更好的泛化能力，并且来自动作识别模型的表示对于AQA任务来说是不够的，而应该进行专门的学习。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供