Command Palette

Search for a command to run...

4ヶ月前

状況に応じたマルチモーダルコンテキストの埋め込み学習による会話エージェントの構築

状況に応じたマルチモーダルコンテキストの埋め込み学習による会話エージェントの構築

要約

状況に即したインタラクティブなマルチモーダル会話(SIMMC)2.0は、オブジェクトの視覚的外観とユーザーの発話といった複雑なマルチモーダル入力を処理できる仮想ショッピングアシスタントの構築を目指している。本タスクは、マルチモーダルな曖昧性解消(MM-Disamb)、マルチモーダルな共参照解決(MM-Coref)、マルチモーダルな対話状態追跡(MM-DST)、および応答の検索と生成の4つのサブタスクから構成される。多くのタスク指向型会話システムは各サブタスクを個別に処理するが、本研究では視覚情報も統合する一貫したマルチモーダルエンコーダ・デコーダを共同学習させ、すべての4つのサブタスクを一度に処理する効率的なアプローチを提案する。この手法は、第10回対話システム技術チャレンジ(DSTC10)において、単一の統合モデルでMM-Corefおよび応答検索のサブタスクで優勝し、残りのサブタスクにおいても準優勝を獲得した。これにより、マルチモーダルなタスク指向型会話システムという新規タスクに対する高い基準が確立された。

ベンチマーク

ベンチマーク方法論指標
dialogue-state-tracking-on-simmc2-0BART-base
Act F1: 95.2
Slot F1: 82.0
dialogue-state-tracking-on-simmc2-0BART-large
Act F1: 96.3
Slot F1: 88.3
response-generation-on-simmc2-0BART-large
BLEU: 33.1

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
状況に応じたマルチモーダルコンテキストの埋め込み学習による会話エージェントの構築 | 論文 | HyperAI超神経