HyperAIHyperAI

Command Palette

Search for a command to run...

IQuest-Coder-V1 技術報告

Abstract

本報告では、コード大規模言語モデル(LLM)の新シリーズである IQuest-Coder-V1シリーズ(7B/14B/40B/40B-Loop) を紹介する。従来の静的コード表現を越え、パイプラインの異なる段階におけるソフトウェア論理の動的進化を捉える「コードフロー多段階学習枠組み」を提案する。本モデルは、初期の事前学習(コード事実、リポジトリデータ、コード補完データを用いた)を起点として、進化的なパイプラインによって開発された。その後、32kコンテキストにおいて推論とエージェント的行動軌道を統合する専門的な中間学習段階を実装し、128kコンテキストにおけるリポジトリスケールでの学習を通じて、深い論理的基盤を構築する。さらに、最終段階として、専門的なコーディング能力を強化する後学習を実施し、そのプロセスを二つの専門的パスに分岐させる:思考パス(推論駆動型強化学習を活用)と指示パス(汎用的支援を最適化)。IQuest-Coder-V1は、エージェント型ソフトウェア工学、競技プログラミング、複雑なツール利用というコード知能の重要な評価指標において、競合モデルと比較して最先端の性能を達成している。デプロイ制約に対応するため、IQuest-Coder-V1-Loop というバリエーションでは、モデル容量とデプロイ領域のトレードオフを最適化するための再帰的機構を導入しており、効率的な性能-効率性のバランスを実現するアーキテクチャ強化型のアプローチを提供する。本研究では、IQuest-Coder-V1シリーズの公開(事前学習基盤から最終的な思考モデルおよび指示モデルに至るまでの完全な白箱的チェーンのチェックポイントを含む)が、自律的コード知能および現実世界のエージェントシステムに関する研究の進展に貢献すると確信している。


Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています