1ヶ月前
編集ベースのSQLクエリ生成におけるクロスドメイン文脈依存質問
Rui Zhang; Tao Yu; He Yang Er; Sungrok Shim; Eric Xue; Xi Victoria Lin; Tianze Shi; Caiming Xiong; Richard Socher; Dragomir Radev

要約
我々はクロスドメインの文脈依存的なテキストからSQLへの生成タスクに焦点を当てています。隣接する自然言語の質問がしばしば言語的に依存しており、それに対応するSQLクエリが重複しがちなことを観察し、予測された前のクエリを編集することで生成品質の向上を目指しています。当社の編集メカニズムはSQLをシーケンスとして捉え、トークンレベルで生成結果を単純な方法で再利用します。これは個々のトークンを柔軟に変更でき、エラー伝播にも堅牢です。さらに、異なるドメインにおける複雑なテーブル構造に対処するために、発話-テーブルエンコーダーとテーブル意識型デコーダーを使用して、ユーザーの発話とテーブルスキーマの文脈を取り入れています。我々の手法はSParCデータセット上で評価され、ゼロからSQLを生成する最先端のベースラインと比較して編集による利点が示されています。当社のコードはhttps://github.com/ryanzhumich/sparc_atis_pytorch で公開されています。