Ensemble De Données De Dialogue Multimodal À Grande Échelle OpenViDial
Date
il y a 3 ans
URL de publication
URL de l'article
Licence
其他

OpenViDial est un ensemble de données de conversation multimodales à grande échelle. OpenViDial extrait les dialogues et le contexte visuel des œuvres cinématographiques et télévisuelles, et chaque dialogue est associé au contexte visuel dans lequel il se produit.
L'ensemble de données OpenViDial contient un total de 1,1 million de tours de dialogue, et donc 1,1 million de contextes visuels stockés dans des images.