Search for a command to run...
NaverがActivityNet Challenge 2019 -- タスクB アクティブ話者検出 (AVA) で
本報告は、CVPR 2019のActivityNetチャレンジへの提出内容について説明しています。我々は3次元畳み込みニューラルネットワーク(3D CNN)をフロントエンドに使用し、時間的な畳み込みとLSTM分類器のアンサンブルを用いて、画面上の人物が話しているかどうかを予測する手法を開発しました。実験結果は、AVA-ActiveSpeakerデータセットにおいてベースラインに対して大幅な改善を示しています。
アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。