2ヶ月前
DataGpt-SQL-7B: テキストからSQLへの変換に向けたオープンソース言語モデル
Wu, Lixia ; Li, Peng ; Lou, Junhong ; Fu, Lei

要約
自然言語のクエリをSQLコマンドに翻訳する重要な役割に対処するために、非専門ユーザーがデータアクセスと分析を民主化できるように、コンパクトで微調整されたモデルと自己改良メカニズムを提案します。これにより、クローズドソースの大規模言語モデルに関連するリスクを軽減できます。具体的には、Text-to-SQL用および偏好データセット用に2万件以上のサンプルからなるデータセットを作成し、SQL生成分野での効率性を向上させました。さらにコードの有効性を確保するために、モデルにコード修正機能を統合しました。当社のシステムDataGpt-sqlは、spider-devにおいて87.2%の精度を達成し、テキストからSQLへの変換タスクにおける当社ソリューションの効果性を示しています。コード、データ、およびモデルは \url{https://github.com/CainiaoTechAi/datagpt-sql-7b} で公開されています。