Command Palette
Search for a command to run...
{Anonymous}

要約
近年、対話プロセスにおいて自然言語をSQLに翻訳する文脈依存型テキストtoSQL意味解析が注目を集めている。従来の手法は、対話履歴の発話や過去に予測されたSQLクエリから文脈依存情報を活用していたが、自然言語と論理形式のSQLとの間に存在する不一致のため、両方の情報を同時に有効に活用できていなかった。本研究では、履歴発話と直前の予測SQLクエリの両方から文脈依存情報を活用できる「履歴情報強化型テキストtoSQLモデル(HIE-SQL)」を提案する。この不一致の問題に対処するため、自然言語とSQLを2つのモダリティとして捉え、両者の間のギャップを埋めるためのバイモーダル事前学習モデルを提案する。さらに、発話とSQLクエリがデータベーススキーマにどのように関連するかを強化するため、スキーマリンクグラフを設計した。実験の結果、履歴情報強化手法によりHIE-SQLの性能が大幅に向上し、著しい新記録を達成した。本稿執筆時点において、SparCおよびCoSQLという2つの文脈依存型テキストtoSQLベンチマークにおいて、いずれも最新の最先端(state-of-the-art)の結果を達成した。
ベンチマーク
| ベンチマーク | 方法論 | 指標 |
|---|---|---|
| dialogue-state-tracking-on-cosql | HIE-SQL + GraPPa | interaction match accuracy: 24.6 question match accuracy: 53.9 |
| text-to-sql-on-sparc | HIE-SQL + GraPPa | interaction match accuracy: 42.9 question match accuracy: 64.6 |