17日前

RAT-SQL:テキストからSQLへのパーサーにおける関係認識型スキーマエンコーディングとリンク

Bailin Wang, Richard Shin, Xiaodong Liu, Oleksandr Polozov, Matthew Richardson
RAT-SQL:テキストからSQLへのパーサーにおける関係認識型スキーマエンコーディングとリンク
要約

自然言語による質問をデータベースからの質問に答えるためのSQLクエリに変換する際、現在の意味解析モデルは未観測のデータベーススキーマに一般化する能力に課題を抱えている。この一般化の困難は、(a) 意味解析器がアクセス可能な形でデータベースの関係を符号化すること、および (b) 与えられたクエリにおけるカラムの参照とそのカラムとの対応付け(アライメント)をモデル化することの2点に起因する。本研究では、関係意識型自己注意機構(relation-aware self-attention mechanism)に基づく統一フレームワークを提示し、テキストからSQLへのエンコーダー内において、スキーマ符号化、スキーマリンク、特徴表現を一貫して扱う。難易度の高いSpiderデータセットにおいて、このフレームワークは正確一致(exact match)精度を57.2%まで向上させ、最も優れた既存手法を8.7%の絶対値で上回った。さらにBERTを組み合わせて拡張した場合、Spiderリーダーボードにおいて65.6%という新たな最先端(state-of-the-art)性能を達成した。また、モデルのスキーマリンクおよびアライメントに関する理解において、定性的な改善も観察された。本研究の実装コードは、https://github.com/Microsoft/rat-sql にてオープンソースとして公開される予定である。