Command Palette
Search for a command to run...
動画内の密集キャプションイベント:ActivityNet Challenge 2020 へのSYSU提出
動画内の密集キャプションイベント:ActivityNet Challenge 2020 へのSYSU提出
Teng Wang Huicheng Zheng Mingjing Yu
概要
本技術報告では、ActivityNet Challenge 2020 の密集動画キャプション(dense video captioning)タスクへの当研究チームの提出内容について概説する。本手法は二段階のパイプラインに基づくものである。第一段階では、時系列的なイベント候補(temporal event proposals)を抽出する。第二段階では、イベントレベルの時系列的関係を捉え、多モーダル情報を効果的に統合するためのマルチイベントキャプションモデルを提案する。本手法は、テストセットにおいて9.28のMETEORスコアを達成した。