Command Palette

Search for a command to run...

25日前

抽出-0:ドキュメント情報抽出のための専門化された言語モデル

Henrique Godoy

抽出-0:ドキュメント情報抽出のための専門化された言語モデル

要約

本稿では、ドキュメント情報抽出に特化して最適化された70億パラメータの言語モデル「Extract-0」を紹介する。このモデルは、数桁大きいパラメータ数を持つモデルを上回る性能を達成している。Extract-0は、合成データ生成、低ランク適応(LoRA)を用いた教師ありファインチューニング、およびグループ相対方策最適化(GRPO)による強化学習という独自の組み合わせにより、多様なドキュメント抽出タスク1,000件から構成されるベンチマークにおいて平均報酬0.573を達成し、GPT-4.1(0.457)、o3(0.464)、GPT-4.1-2025(0.459)を上回る性能を発揮した。訓練手法は、記憶保持型の合成データ生成パイプラインを採用しており、多様なドキュメントソースから280,128件のトレーニング例を生成した。その後、パラメータ効率的なファインチューニングにより、モデルの重みのわずか0.53%(76.6億パラメータ中4,040万パラメータ)のみを変更した。強化学習フェーズでは、情報抽出タスクに内在する曖昧性に対応できる新しい意味的類似度に基づく報酬関数を導入した。本研究は、タスク特化型の最適化によって、汎用モデルを上回る性能を持つモデルを構築可能であり、かつ大幅に少ない計算リソースで実現できることを示している。

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
抽出-0:ドキュメント情報抽出のための専門化された言語モデル | 論文 | HyperAI超神経