HyperAI超神経

CoSQL 会話テキストから SQL データ セットへ

日付

8ヶ月前

サイズ

100.44 MB

組織

イェール大学

CoSQL (Conversational Text-to-SQL Challenge) データセットは、クロスドメインのユニバーサル データベース クエリ対話システム データセットを構築することを目的として、EMNLP2019 でイェール大学によって提案されました。

CoSQL には 3,000 を超える会話グループ、合計 10,000 を超える注釈付き SQL クエリが含まれており、その内容は 200 のデータベースに及び、モデルの堅牢性を調べるために異なるデータ グループで使用されるデータベースは重複しません。データ セットは、実際のシナリオでデータベース クエリをシミュレートします。ユーザー クエリには複数のラウンドがかかる場合があり、システムには情報を統合する機能が必要です。

CoSQL には 3 つのタスクが含まれています。

  • SQL ベースの対話状態追跡: インタラクション履歴に基づいて、対応する SQL ステートメントに変換されます。
  • 自然言語応答の生成: SQL ステートメントと返された結果に基づいて自然言語応答を生成します。
  • ユーザー対話行為予測:ユーザーの質問ごとに、どのDBユーザーラベルに属するかを判定します。
コSQL.torrent
シーディング 1ダウンロード中 0ダウンロード完了 74総ダウンロード数 94
  • CoSQL/
    • README.md
      1.54 KB
    • README.txt
      3.09 KB
      • data/
        • cosql_dataset.zip
          100.44 MB