16日前
PET-SQL:クロス整合性を備えたプロンプト強化型二段階精緻化テキストtoSQL
Zhishuai Li, Xiang Wang, Jingjing Zhao, Sun Yang, Guoqing Du, Xiaoru Hu, Bin Zhang, Yuxiao Ye, Ziyue Li, Rui Zhao, Hangyu Mao

要約
近年のText-to-SQL(Text2SQL)分野における進展は、コンテキスト内学習(in-context learning)を活用して大規模言語モデル(LLM)の性能を引き出すことに注力しており、顕著な成果が得られている。しかし、冗長なデータベース情報や複雑なユーザーの意図に対処する際には依然として課題が残っている。本論文では、現在のLLMベースの自然言語からSQLへの変換システムの性能を向上させるため、二段階フレームワークを提案する。まず、スキーマ情報とテーブルからランダムに抽出されたセル値を含む新たなプロンプト表現「リファレンス強化表現(reference-enhanced representation)」を導入し、LLMがSQLクエリを生成する際の指示を強化する。次に、第一段階として、類似する質問-SQLペアを検索し、少サンプルのデモンストレーションとして用いることで、LLMに初期SQL(PreSQL)を生成させる。その後、PreSQLに含まれる参照エンティティを解析し、スキーマリンクを実行することで、有用な情報を大幅に圧縮する。第二段階では、リンク済みのスキーマを基にプロンプト内のスキーマ情報を簡略化し、LLMに最終的なSQLを生成させる。最後に、後処理モジュールとして、特定のLLM内での自己一貫性(self-consistency)ではなく、異なるLLM間でのクロス一貫性(cross-consistency)を活用する手法を提案する。本手法はSpiderベンチマークにおいて、実行精度87.6%という新たなSOTA(State-of-the-Art)を達成した。