HyperAI
Command Palette
Search for a command to run...
OpenViDial 大規模マルチモーダル対話データセット

OpenViDial は、大規模なマルチモーダル対話データセットです。 OpenViDial は、映画やテレビの作品から対話ターンと視覚的コンテキストを抽出し、各対話ターンは、それが発生する視覚的コンテキストと照合されます。
OpenViDial データセットには合計 110 万の対話ターンが含まれているため、画像には 110 万の視覚的コンテキストが保存されます。
このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。