Ensemble De Données De Dialogue Multimodal À Grande Échelle OpenViDial
Date
il y a 3 ans
URL de publication
Licence
其他
Catégories

OpenViDial est un ensemble de données de conversation multimodales à grande échelle. OpenViDial extrait les dialogues et le contexte visuel des œuvres cinématographiques et télévisuelles, et chaque dialogue est associé au contexte visuel dans lequel il se produit.
L'ensemble de données OpenViDial contient un total de 1,1 million de tours de dialogue, et donc 1,1 million de contextes visuels stockés dans des images.