2ヶ月前

TransNet V2: 高速カット移行検出のための効果的な深層ネットワークアーキテクチャ

Souček, Tomáš ; Lokoč, Jakub
TransNet V2: 高速カット移行検出のための効果的な深層ネットワークアーキテクチャ
要約

自動的なショット遷移検出手法は、すでに20年以上にわたって研究されてきましたが、効果的な普遍的人間レベルのモデルはまだ提案されていません。一般的なショット遷移であるカットや単純な漸進的な変化であっても、分析されるビデオコンテンツの多様性により、誤検出と見逃しが依然として発生する可能性があります。最近では、3次元畳み込み構造と人工的に生成された学習データを使用した深層学習ベースのアプローチが、ショット遷移検出の精度を大幅に向上させました。しかし、100%の精度は未だに達成不可能な理想となっています。本論文では、尊敬されるベンチマークで最先端の性能を達成している当方の深層ネットワークTransNet V2の現在版を共有します。学習済みモデルの一例が提供されているため、コミュニティは大規模なビデオアーカイブの高効率的な分析にすぐに利用することができます。さらに、ネットワーク構造および学習プロセスに関する経験について詳細に説明し、提案されたモデルの便利な使用方法と結果の可視化のために簡単なコードスニペットも含めています。

TransNet V2: 高速カット移行検出のための効果的な深層ネットワークアーキテクチャ | 最新論文 | HyperAI超神経