7ヶ月前

畳み込みニューラルネットワーク

ビデオ処理

アプローチ／フレームワーク

コンピュータビジョン

Du Tran Lubomir Bourdev Rob Fergus Lorenzo Torresani Manohar Paluri

概要

私たちは、大規模な教師ありビデオデータセットを用いて深層3次元畳み込みニューラルネットワーク（3D ConvNets）で学習した空間時間特徴量の学習手法を提案します。本研究の結果は以下の3点にまとめられます：1) 3D ConvNetsは2D ConvNetsよりも空間時間特徴量の学習に適している；2) 全ての層で小さな3x3x3畳み込みカーネルを使用する均一なアーキテクチャが、3D ConvNetsの中で最も高性能なアーキテクチャの一つである；そして3) 私たちが学習した特徴量、すなわちC3D（Convolutional 3D）は単純な線形分類器と組み合わせることで、4つの異なるベンチマークにおいて最先端の方法を上回り、他の2つのベンチマークでも現在の最良の方法と同等の性能を示しました。さらに、これらの特徴量はコンパクトであり、UCF101データセットではわずか10次元で52.8%の精度を達成しています。また、ConvNetsによる高速推論のおかげで計算効率も非常に高いです。最後に、これらの特徴量は概念的に非常に単純で、訓練や使用も容易です。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

7ヶ月前

畳み込みニューラルネットワーク

ビデオ処理

アプローチ／フレームワーク

コンピュータビジョン

Du Tran Lubomir Bourdev Rob Fergus Lorenzo Torresani Manohar Paluri

概要

私たちは、大規模な教師ありビデオデータセットを用いて深層3次元畳み込みニューラルネットワーク（3D ConvNets）で学習した空間時間特徴量の学習手法を提案します。本研究の結果は以下の3点にまとめられます：1) 3D ConvNetsは2D ConvNetsよりも空間時間特徴量の学習に適している；2) 全ての層で小さな3x3x3畳み込みカーネルを使用する均一なアーキテクチャが、3D ConvNetsの中で最も高性能なアーキテクチャの一つである；そして3) 私たちが学習した特徴量、すなわちC3D（Convolutional 3D）は単純な線形分類器と組み合わせることで、4つの異なるベンチマークにおいて最先端の方法を上回り、他の2つのベンチマークでも現在の最良の方法と同等の性能を示しました。さらに、これらの特徴量はコンパクトであり、UCF101データセットではわずか10次元で52.8%の精度を達成しています。また、ConvNetsによる高速推論のおかげで計算効率も非常に高いです。最後に、これらの特徴量は概念的に非常に単純で、訓練や使用も容易です。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています