한국어

OpenViDial 대규모 다중 모드 대화 데이터 세트

날짜

3년 전

기관

발행 주소

논문 URL

라이선스

其他

태그

OpenViDial은 대규모 다중 모드 대화 데이터 세트입니다. OpenViDial은 영화와 TV 작품에서 대화 장면과 시각적 맥락을 추출하고, 각 대화 장면은 해당 대화가 발생하는 시각적 맥락과 일치합니다.

OpenViDial 데이터 세트에는 총 110만 개의 대화 내용이 포함되어 있으며, 따라서 110만 개의 시각적 맥락이 이미지에 저장되어 있습니다.

OpenViDial 대규모 다중 모드 대화 데이터 세트 | 데이터셋 | HyperAI초신경