HyperAIHyperAI

Command Palette

Search for a command to run...

Ubuntuダイアログコーパス:非構造化マルチターンダイアログシステムの研究用大規模データセット

Ryan Lowe Nissan Pow Iulian V. Serban Joelle Pineau

概要

本論文では、Ubuntuダイアログコーパスを紹介します。このデータセットには、約100万のマルチターンダイアログが含まれており、総発話数は700万を超え、単語数は1億に達しています。これは、大量のラベルなしデータを利用できるニューラル言語モデルに基づくダイアログマネージャーの構築に関する研究にとって、独自のリソースを提供します。このデータセットは、Dialog State Tracking Challengeデータセットにおける会話のマルチターン特性と、Twitterなどのマイクロブログサービスから得られる相互作用の非構造的性質を兼ね備えています。また、このデータセットの分析に適した2つのニューラル学習アーキテクチャについて説明し、最適な次の応答を選択するタスクでのベンチマーク性能も示します。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
Ubuntuダイアログコーパス:非構造化マルチターンダイアログシステムの研究用大規模データセット | 記事 | HyperAI超神経