iQIYI-VID マルチモーダルビデオキャラクターデータセット

日期

2 年前

机构

许可协议

其他

分类

下载帮助
特色图像

iQIYI-VID は、マルチモーダルなビデオ人物データセットです。このデータ セットには、5,000 人の有名アーティストと 1,000 時間分の 500,000 のビデオ クリップが含まれており、それぞれの長さは 1 ~ 30 秒です。ビデオ クリップは、iQiyi のバラエティ番組、映画、テレビ シリーズからのものです。各ビデオ クリップには、エラー率が 0.2% 未満になるように手動で注釈が付けられます。研究者らは、iQIYI-VID データセット上の顔認識、人物の再識別、話者識別のための最先端のモデルを評価しました。