2ヶ月前

多視点文脈常識推論:新しいデータセットとタスク

Siqi Shen; Deepanway Ghosal; Navonil Majumder; Henry Lim; Rada Mihalcea; Soujanya Poria
多視点文脈常識推論:新しいデータセットとタスク
要約

コンテクストに依存した常識推論は、二人の対話における出来事に関する様々な説明(原因、動機、感情反応など)を生成するタスクです。一貫性があり且つ自明でない説明を生成するには、対話の構造と出来事がコンテクストの中でどのように根ざしているかを理解することが必要です。本研究では、CICEROv2というデータセットを作成しました。このデータセットには2,379件の対話から8,351件のインスタンスが含まれており、各コンテクストに依存した常識推論問題に対して複数の人間が書いた回答が含まれています。これらの回答は原因、その後の出来事、動機、感情反応といった種類の説明を表しています。我々はCICEROv2の推論が他のコンテクストに依存した常識推論データセットよりも意味的に多様であることを示しました。この推論タスクを解決するために、概念除去(concept denoising)や発話並べ替え(utterance sorting)などの前処理目的を提案し、下流のコンテクストに依存した常識推論タスクのために事前学習モデルを準備します。実験結果は、提案した前処理目的がT5-Largeモデルをコンテクストに依存した常識推論タスクに適応させる上で効果的であることを示しています。

多視点文脈常識推論:新しいデータセットとタスク | 最新論文 | HyperAI超神経