HyperAIHyperAI

Command Palette

Search for a command to run...

敵対的学習を用いたニューラル対話生成

Jiwei Li; Will Monroe; Tianlin Shi; Sébastien Jean; Alan Ritter; Dan Jurafsky

概要

本論文では、チューリングテストの直感を基に、オープンドメイン対話生成に敵対的訓練を使用することを提案する。システムは、人間が生成した対話発話を区別できないようなシーケンスを生成するために訓練される。このタスクを強化学習(Reinforcement Learning, RL)の問題として定式化し、応答シーケンスを生成する生成モデルと、人間が生成した対話と機械が生成した対話を区別する識別器(チューリングテストにおける人間の評価者に相当)の2つのシステムを共同で訓練する。識別器からの出力は、生成モデルに対する報酬として使用され、システムが主に対人間のような対話を生成するように促す。また、敵対的訓練に加えて、敵対者がだまされることの成功度を対話評価指標として使用するための敵対的{\em 評価}モデルについても説明する。このモデルは、潜在的な落とし穴を避けるために設計されている。複数の指標、特に敵対的評価を含む実験結果は、敵対的に訓練されたシステムが以前のベースラインよりも高品質な応答を生成することを示している。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています