
要約
近年、対話プロセスにおいて自然言語をSQLに翻訳する文脈依存型テキストtoSQL意味解析が注目を集めている。従来の手法は、対話履歴の発話や過去に予測されたSQLクエリから文脈依存情報を活用していたが、自然言語と論理形式のSQLとの間に存在する不一致のため、両方の情報を同時に有効に活用できていなかった。本研究では、履歴発話と直前の予測SQLクエリの両方から文脈依存情報を活用できる「履歴情報強化型テキストtoSQLモデル(HIE-SQL)」を提案する。この不一致の問題に対処するため、自然言語とSQLを2つのモダリティとして捉え、両者の間のギャップを埋めるためのバイモーダル事前学習モデルを提案する。さらに、発話とSQLクエリがデータベーススキーマにどのように関連するかを強化するため、スキーマリンクグラフを設計した。実験の結果、履歴情報強化手法によりHIE-SQLの性能が大幅に向上し、著しい新記録を達成した。本稿執筆時点において、SparCおよびCoSQLという2つの文脈依存型テキストtoSQLベンチマークにおいて、いずれも最新の最先端(state-of-the-art)の結果を達成した。