7ヶ月前

コンピュータビジョン

ビデオ理解

ディープラーニング

コンピュータビジョン

Ioannis Patras Vasileios Mezaris Alexandros I. Metsai Eleni Adamantidou Evlampios Apostolidis

概要

本稿では、教師なし動画要約のための新たな手法を提案する。提案するアーキテクチャは、Actor-Criticモデルを生成対抗ネットワーク（Generative Adversarial Network, GAN）に組み込み、要約に用いる重要な動画断片の選択を、シーケンス生成タスクとして定式化している。ActorとCriticは、逐次的に動画のキーフラグメントの選択に導くゲームに参加し、各ステップにおけるその選択は、ディスクリミネータ（Discriminator）から得られる報酬として反映される。設計された学習ワークフローにより、ActorとCriticは行動空間を探索し、キーフラグメント選択のためのポリシーを自動的に学習できる。さらに、学習終了後に最適なモデルを選定するための評価基準を導入することで、データから学習されないパラメータ（たとえば正則化係数σ）の適切な値を自動的に選定することが可能となる。SumMeおよびTVSumの2つのベンチマークデータセットにおける実験評価により、提案モデルであるAC-SUM-GANが、教師なし手法としては一貫して優れた性能を発揮し、さらに教師あり手法と比較しても競争力のある結果を達成することが示された。

ソースPDF コードを表示

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

7ヶ月前

コンピュータビジョン

ビデオ理解

ディープラーニング

コンピュータビジョン

Ioannis Patras Vasileios Mezaris Alexandros I. Metsai Eleni Adamantidou Evlampios Apostolidis

概要

本稿では、教師なし動画要約のための新たな手法を提案する。提案するアーキテクチャは、Actor-Criticモデルを生成対抗ネットワーク（Generative Adversarial Network, GAN）に組み込み、要約に用いる重要な動画断片の選択を、シーケンス生成タスクとして定式化している。ActorとCriticは、逐次的に動画のキーフラグメントの選択に導くゲームに参加し、各ステップにおけるその選択は、ディスクリミネータ（Discriminator）から得られる報酬として反映される。設計された学習ワークフローにより、ActorとCriticは行動空間を探索し、キーフラグメント選択のためのポリシーを自動的に学習できる。さらに、学習終了後に最適なモデルを選定するための評価基準を導入することで、データから学習されないパラメータ（たとえば正則化係数σ）の適切な値を自動的に選定することが可能となる。SumMeおよびTVSumの2つのベンチマークデータセットにおける実験評価により、提案モデルであるAC-SUM-GANが、教師なし手法としては一貫して優れた性能を発揮し、さらに教師あり手法と比較しても競争力のある結果を達成することが示された。

ソースPDF コードを表示

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています