HyperAI

Ensemble De Données De Dialogue Multimodal À Grande Échelle OpenViDial

Aide au téléchargement
特色图像

OpenViDial est un ensemble de données de conversation multimodales à grande échelle. OpenViDial extrait les dialogues et le contexte visuel des œuvres cinématographiques et télévisuelles, et chaque dialogue est associé au contexte visuel dans lequel il se produit.

L'ensemble de données OpenViDial contient un total de 1,1 million de tours de dialogue, et donc 1,1 million de contextes visuels stockés dans des images.