HyperAI超神経

ActivityNet エンティティの字幕データ セット

日付

3年前

組織

ダウンロードヘルプ
特色图像

ActivityNet-Entities は、ActivityNet Captions 字幕データセットに 158k のバウンディング ボックス アノテーションを追加します。各注釈は名詞句です。このデータは、ビデオ記述モデルをトレーニングするために使用できます。このデータセットは、ビデオに基づいて説明を生成するモデルの有効性を示し、また、画像の説明を Flickr30k データセットに適用する方法も示します。