2ヶ月前

Seq2SQL: 自然言語から構造化クエリを生成する強化学習の利用

Victor Zhong; Caiming Xiong; Richard Socher
Seq2SQL: 自然言語から構造化クエリを生成する強化学習の利用
要約

世界の多くの知識はリレーショナルデータベースに保存されています。しかし、ユーザーがデータベースから情報を検索する能力は、SQLなどのクエリ言語の理解不足により制限されています。本研究では、自然言語の質問を対応するSQLクエリに翻訳する深層ニューラルネットワークであるSeq2SQLを提案します。当モデルはSQLクエリの構造を利用し、生成されるクエリの出力空間を大幅に削減します。さらに、データベース上で実行される中間ループ内のクエリ実行からの報酬を使用して、クロスエントロピー損失による最適化が適していないと示されたクエリの順不同部分を生成するためのポリシーを学習します。また、ウィキペディアから抽出した24241つのテーブルにわたる80654件の手動注釈付き質問とSQLクエリの例を集めたデータセットWikiSQLを公開します。このデータセットは当モデルの訓練に必要であり、類似するデータセットよりも一桁大きい規模です。WikiSQLに対してポリシーに基づく強化学習とクエリ実行環境を適用することで、当モデルSeq2SQLは注意機構を持つシーケンス・ツー・シーケンスモデルを上回り、実行精度を35.9%から59.4%へ、論理形式精度を23.4%から48.3%へ向上させました。

Seq2SQL: 自然言語から構造化クエリを生成する強化学習の利用 | 最新論文 | HyperAI超神経