6ヶ月前

概要

大規模言語モデル（LLM）を用いたテキストからSQLへの変換（text-to-SQL）という困難なタスクにおいて、ファインチューニングされたモデルとプロンプティング手法の間には、現状大きな性能差が存在している。特にSpiderなどのデータセットを用いた評価において、この差は顕著である。本研究では、LLMの推論プロセスにおける性能向上を図るため、タスクをより小さなサブタスクに分解することの有効性を検討した。特に、生成問題を複数のサブ問題に分割し、その各サブ問題の解決結果をLLMにインプットすることで、性能を著しく向上させる有効なアプローチであることを示した。3種類のLLMを用いた実験の結果、このアプローチは単純なフェイショット（few-shot）性能を約10%向上させ、LLMの性能をSOTA（最良の報告済み性能）に近づけ、あるいはそれを上回ることを実現した。Spiderのホールドアウトテストセットにおいて、本研究執筆時点でのSOTA（実行精度）は79.9であったが、本手法を用いることで85.3という新たなSOTAを達成した。また、文脈内学習（in-context learning）を活用した本アプローチは、多数の高度にファインチューニングされたモデルを少なくとも5%以上上回った。さらに、BIRDベンチマークにおける評価では、実行精度55.9%を達成し、同ベンチマークのホールドアウトテストセットにおいて新たなSOTAを樹立した。

ソースPDF