Command Palette
Search for a command to run...
PYSKL:骨格行動認識における良好な実践への指向
PYSKL:骨格行動認識における良好な実践への指向
Haodong Duan Jiaqi Wang Kai Chen Dahua Lin
概要
本稿では、PyTorchを基盤とする骨格ベースの行動認識用オープンソースツールボックス「PYSKL」を紹介する。このツールボックスは、GCN(グラフカーネルネットワーク)およびCNN(畳み込みニューラルネットワーク)に基づく多様な骨格行動認識アルゴリズムをサポートしており、既存のオープンソースプロジェクトが1~2つのアルゴリズムしか含まないのに対し、PYSKLは一貫したフレームワーク下に6種類の異なるアルゴリズムを実装し、最新の手法と元々の優れた実践法を併用することで、性能と効率の比較を容易にする。さらに、複雑な注目機構(attention scheme)を用いずに競争力ある認識性能を達成するオリジナルのGCNベースの骨格行動認識モデル「ST-GCN++」も提案する。このモデルは強力なベースラインとしての役割を果たす。一方、PYSKLは9種類の骨格ベース行動認識ベンチマークに対する学習と評価をサポートしており、そのうち8つにおいて最先端の認識性能を達成している。今後の骨格行動認識に関する研究を促進するため、多数の事前学習済みモデルおよび詳細なベンチマーク結果を公開し、研究のインサイトを提供している。PYSKLはGitHub(https://github.com/kennymckormick/pyskl)にて公開されており、継続的にメンテナンスされている。新機能やベンチマークの追加に応じて本報告書も更新する予定である。現在のバージョンはPYSKL v0.2に対応している。