6ヶ月前

畳み込みニューラルネットワーク

セマンティックセグメンテーション

ビデオ処理

アプローチ／フレームワーク

コンピュータビジョン

Dipika Singhania Rahul Rahaman Angela Yao

概要

時系列畳み込みネットワーク（Temporal Convolutional Networks: TCNs）は、時系列動画セグメンテーションにおいて広く用いられるアーキテクチャである。しかし、TCNは過剰セグメンテーションの誤差に悩まされやすく、滑らかさと時系列的一貫性を確保するためには追加の精緻化モジュールが必要となる。本研究では、シーケンスの断片化問題に対処するため、新たな時系列エンコーダ・デコーダ構造を提案する。特に、デコーダは複数の時系列解像度を暗黙的にアンサンブルする粗いものから細かいものへの構造を採用している。このアンサンブルにより、より滑らかで精度が高く、より適切にキャリブレーションされたセグメンテーションが得られ、追加の精緻化モジュールの導入を回避できる。さらに、変動する時系列解像度に対するロバスト性を高めるため、マルチ解像度特徴拡張戦略を訓練プロセスに組み込む。最後に、本アーキテクチャの性能をさらに向上させ、時系列的一貫性を促進するため、動画レベルでの誤分類をペナルティとするアクション損失関数を提案する。実験の結果、本研究で提案する単独のアーキテクチャに加え、新規の特徴拡張戦略および新しい損失関数を組み合わせた手法が、3つの時系列動画セグメンテーションベンチマークにおいて、最先端の手法を上回る性能を達成した。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

6ヶ月前

畳み込みニューラルネットワーク

セマンティックセグメンテーション

ビデオ処理

アプローチ／フレームワーク

コンピュータビジョン

Dipika Singhania Rahul Rahaman Angela Yao

概要

時系列畳み込みネットワーク（Temporal Convolutional Networks: TCNs）は、時系列動画セグメンテーションにおいて広く用いられるアーキテクチャである。しかし、TCNは過剰セグメンテーションの誤差に悩まされやすく、滑らかさと時系列的一貫性を確保するためには追加の精緻化モジュールが必要となる。本研究では、シーケンスの断片化問題に対処するため、新たな時系列エンコーダ・デコーダ構造を提案する。特に、デコーダは複数の時系列解像度を暗黙的にアンサンブルする粗いものから細かいものへの構造を採用している。このアンサンブルにより、より滑らかで精度が高く、より適切にキャリブレーションされたセグメンテーションが得られ、追加の精緻化モジュールの導入を回避できる。さらに、変動する時系列解像度に対するロバスト性を高めるため、マルチ解像度特徴拡張戦略を訓練プロセスに組み込む。最後に、本アーキテクチャの性能をさらに向上させ、時系列的一貫性を促進するため、動画レベルでの誤分類をペナルティとするアクション損失関数を提案する。実験の結果、本研究で提案する単独のアーキテクチャに加え、新規の特徴拡張戦略および新しい損失関数を組み合わせた手法が、3つの時系列動画セグメンテーションベンチマークにおいて、最先端の手法を上回る性能を達成した。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています