Command Palette

Search for a command to run...

4ヶ月前

深さ方向分離型時系列畳み込みネットワークを用いたアクションセグメンテーション

{Heiko Neumann Wolfgang Mader Christian Jarvers Basavaraj Hampiholi}

要約

長時間かつトリムされていないRGB動画における細粒度な時系列行動分割は、視覚的情報処理における人間と機械のインタラクション分野における重要な課題である。近年の時系列畳み込みに基づくアプローチは、エンコーダデコーダ(ED)アーキテクチャを採用するか、連続する畳み込み層で倍率を2倍にするドイルーション(dilation)を用いることで、動画内の行動を分割している。しかし、EDネットワークは低時間分解能で動作するため、時間的細部の把握が困難であり、連続層におけるドイルーションはグリッドアーティファクト(gridding artifacts)という問題を引き起こす。本研究では、時間分解能を完全に維持しつつ、グリッドアーティファクトの影響を低減できる、深度可分時系列畳み込みネットワーク(Depthwise Separable Temporal Convolution Network; DS-TCN)を提案する。DS-TCNの基本構成要素は、残差型深度可分ドイルーションブロック(Residual Depthwise Dilated Block; RDDB)である。本研究では、大きなカーネルサイズと小さなドイルーション率の間のトレードオフをRDDBを用いて検討した。その結果、DS-TCNが長距離の時系列依存関係と局所的な時間的特徴を効率的に捉える能力を有することを示した。GTEA、50Salads、Breakfastの3つのベンチマークデータセットにおける評価において、従来のED-TCNおよびドイルーションベースのTCNベースラインと比較して、パラメータ数が少なくても、DS-TCNが優れた性能を発揮することを確認した。

ベンチマーク

ベンチマーク方法論指標
action-segmentation-on-50-salads-1DS-TCN
Acc: 80.0
Edit: 70.0
F1@10%: 77.0
F1@25%: 74.43
F1@50%: 65.78
action-segmentation-on-breakfast-1DS-TCN
Acc: 70.75
Average F1: 59.6
Edit: 69.02
F1@10%: 67.70
F1@25%: 62.05
F1@50%: 49.18
action-segmentation-on-gtea-1DS-TCN
Acc: 78.10
Edit: 84.05
F1@10%: 88.30
F1@25%: 85.44
F1@50%: 72.84

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
深さ方向分離型時系列畳み込みネットワークを用いたアクションセグメンテーション | 論文 | HyperAI超神経