Command Palette
Search for a command to run...
NTU-X:微細な人体行動のポーズベース認識を向上させるための拡張大規模データセット
NTU-X:微細な人体行動のポーズベース認識を向上させるための拡張大規模データセット
Neel Trivedi Anirudh Thatipelli Ravi Kiran Sarvadevabhatla
概要
最新のスケルトン行動認識モデルにおいて、細粒度の関節(顔面関節、手指関節)の欠如は根本的な性能の限界となっている。この限界にもかかわらず、研究コミュニティの努力は新しいアーキテクチャの提案に集中しているにとどまっている。この限界を specifically 解消するため、本研究では2つの新しいポーズベースの人間行動データセット、NTU60-X および NTU120-X を提案する。これらのデータセットは、現在最大規模の行動認識データセットである NTU-RGBD を拡張したものである。NTU-RGBD に含まれる25個の体幹関節に加え、NTU60-X および NTU120-X は手指関節および顔面関節を追加しており、より豊かなスケルトン表現を可能にしている。また、これらの新データセットを用いた学習を可能とするよう、最新の手法を適切に修正した。実験結果から、これらの NTU-X データセットが前述の性能限界を克服し、全体的な性能向上および従来最も低いパフォーマンスを示していた行動カテゴリにおける改善が確認された。コードおよび事前学習済みモデルは、https://github.com/skelemoa/ntu-x にて公開されている。