17日前

AID:情報ドロップ増強を用いた人間のポーズ推定の性能限界の押し上げ

Junjie Huang, Zheng Zhu, Guan Huang, Dalong Du
AID:情報ドロップ増強を用いた人間のポーズ推定の性能限界の押し上げ
要約

姿勢推定において、外見的特徴(appearance cue)と制約的特徴(constraint cue)の両方が重要である。しかし、既存の多くの研究では、前者に過剰に適合(overfitting)しがちであり、後者を軽視しがちである。本論文では、このジレンマを検証し、克服するための手法として、情報ドロップによる拡張(Augmentation by Information Dropping; AID)を提案する。AIDの潜在能力を効果的に活かすための前提として、情報供給の観点から学習過程における損失と性能の変化パターンを分析し、カスタマイズされた学習スケジュールを設計した。実験では、モデル非依存のアプローチとして、AIDは入力サイズ、フレームワーク、バックボーン、学習・テストデータセットが異なるさまざまな最先端手法(ボトムアップおよびトップダウン両パラダイム)において、一貫して性能向上をもたらした。代表的なCOCO姿勢推定テストセットにおいて、トップダウンアプローチでは平均して約0.6 APの向上、ボトムアップアプローチでは最大1.5 APの向上が確認された。さらに困難なCrowdPoseデータセットでは、1.5 AP以上の改善が得られた。AIDは姿勢推定の性能限界を著しく押し上げ、新たな最先端(state-of-the-art)を確立した。本研究の成果を踏まえ、AIDが姿勢推定器の学習における標準的な構成として広く採用されることを期待する。実装コードは今後、公開される予定である。

AID:情報ドロップ増強を用いた人間のポーズ推定の性能限界の押し上げ | 最新論文 | HyperAI超神経