2ヶ月前

Hallucinating IDT Descriptors and I3D Optical Flow Features for Action Recognition with CNNs この文は、SCI/SSCIジャーナルのタイトルとして適切に翻訳すると以下のようになります: 幻覚化されたIDT記述子とI3Dオプティカルフロー特徴量を用いたCNNによる動作認識

Lei Wang; Piotr Koniusz; Du Q. Huynh
Hallucinating IDT Descriptors and I3D Optical Flow Features for Action Recognition with CNNs
この文は、SCI/SSCIジャーナルのタイトルとして適切に翻訳すると以下のようになります:
幻覚化されたIDT記述子とI3Dオプティカルフロー特徴量を用いたCNNによる動作認識
要約

本論文では、古典的な手作りのビデオ表現を行動認識に再利用し、CNN(畳み込みニューラルネットワーク)ベースの幻覚化ステップを通じてこれらの手法に新たな命を吹き込みます。RGBフレームや光流フレームを使用する一方で、I3Dモデル(その他のモデルも含む)は、低レベルのビデオ記述子をBag-of-Words (BoW) およびFisher Vectors (FV) で符号化したImproved Dense Trajectory (IDT) と出力を組み合わせることで優れた性能を発揮します。このようなCNNと手作り表現の融合は、前処理、記述子抽出、符号化、パラメータ調整などにより時間のかかるプロセスとなります。そこで、学習段階でIDTベースのBoW/FV表現を学び、I3Dモデルとの統合が容易なエンドツーエンドで学習可能なネットワークを提案します。具体的には、各ストリームは最終1D畳み込み層前のI3D特徴マップを取り入れ、「翻訳」してこれらのマップをBoW/FV表現に変換します。これにより、テスト段階で当モデルは幻覚化された合成BoW/FV表現を使用することが可能になります。また、I3D光流ストリーム全体の特徴量さえも幻覚化できることが示され、パイプラインが簡素化されます。当モデルは20-55時間の計算時間を節約し、4つの公開データセットにおいて最先端の結果を達成しています。

Hallucinating IDT Descriptors and I3D Optical Flow Features for Action Recognition with CNNs この文は、SCI/SSCIジャーナルのタイトルとして適切に翻訳すると以下のようになります: 幻覚化されたIDT記述子とI3Dオプティカルフロー特徴量を用いたCNNによる動作認識 | 最新論文 | HyperAI超神経