16日前

動画の特徴フレームの独自性と多様性を考慮した集中注目を用いた動画要約

{Ioannis Patras, Vasileios Mezaris, Georgios Balaouras, Evlampios Apostolidis}
動画の特徴フレームの独自性と多様性を考慮した集中注目を用いた動画要約
要約

本研究では、教師なし動画要約のための新しい手法を提案する。既存の教師なし動画要約手法が抱える課題——生成器・識別器アーキテクチャの不安定な学習、長距離フレーム間依存関係のモデル化にRNNの使用、およびRNNベースのネットワークアーキテクチャにおける学習プロセスの並列化の困難さ——を克服するため、本手法は動画フレームの重要度を推定するために、単一の自己注意(self-attention)機構に依拠している。従来の手法がグローバルな注意に基づいてフレーム間依存関係を単純にモデル化するのに対し、本手法は注意行列の主対角線上に非重複するブロックに注目できる集中型注意(concentrated attention)機構を導入し、動画フレームの特異性と多様性に関する知識を抽出・活用することで、既存の情報に豊かさを加える。このアプローチにより、動画の異なる部分に対する重要度の推定がより精度高く行われ、学習可能なパラメータ数を大幅に削減できる。SumMeおよびTVSumという2つのベンチマークデータセットを用いた実験評価により、提案手法が他の最先端の教師なし要約手法と競合可能な性能を示し、人間の好みに極めて近い動画要約の生成が可能であることを実証した。さらに、集中型注意とフレームの特異性・多様性に関する注意ベースの推定を組み合わせた構成要素の寄与を評価するアブレーションスタディにより、各要素が総合的な要約性能に果たす相対的な貢献度が明確に示された。

動画の特徴フレームの独自性と多様性を考慮した集中注目を用いた動画要約 | 最新論文 | HyperAI超神経