OpenViDial 대규모 다중 모드 대화 데이터 세트

OpenViDial은 대규모 다중 모드 대화 데이터 세트입니다. OpenViDial은 영화와 TV 작품에서 대화 장면과 시각적 맥락을 추출하고, 각 대화 장면은 해당 대화가 발생하는 시각적 맥락과 일치합니다.
OpenViDial 데이터 세트에는 총 110만 개의 대화 내용이 포함되어 있으며, 따라서 110만 개의 시각적 맥락이 이미지에 저장되어 있습니다.
OpenViDial은 대규모 다중 모드 대화 데이터 세트입니다. OpenViDial은 영화와 TV 작품에서 대화 장면과 시각적 맥락을 추출하고, 각 대화 장면은 해당 대화가 발생하는 시각적 맥락과 일치합니다.
OpenViDial 데이터 세트에는 총 110만 개의 대화 내용이 포함되어 있으며, 따라서 110만 개의 시각적 맥락이 이미지에 저장되어 있습니다.