2ヶ月前

監視付き微調整

データセット

AIインフラストラクチャ

アプローチ／フレームワーク

Zhengzhong Liu Liping Tang Linghao Jin Haonan Li Nikhil Ranjan Desai Fan Shaurya Rohatgi Richard Fan Omkar Pangarkar Huijuan Wang

概要

本稿では、一般のLLMが有する会話や知識検索などの機能に加え、推論適応のための優れた基盤として、完全に新規に構築された360度オープン型LLM「K2-V2」を紹介する。K2-V2は、同サイズクラスにおけるオープンウェイトモデルのリーダーと並ぶ強力な性能を発揮し、Qwen2.5-72Bを上回る性能を示し、Qwen3-235Bの水準に近づいている。本モデルは、学習プロセス全体にわたり、ドメイン知識、推論能力、長文対応、ツール利用機能を積極的に統合している。これにより、複雑な推論タスクに特化したモデルの構築が明示的に可能となる。単純な教師あり微調整（supervised fine-tuning）を用いてその可能性を実証し、高度なアライメント技術の発展に向けた大きな余地（headroom）を示す強力なベースラインを確立した。また、全学習履歴およびデータ構成を公開することで、継続的学習（continuous training）というオープンソース開発の重要なシナリオにおける効果を最大化した。本研究では、モデル重みおよびLLM360の特徴的なアーティファクト（完全な学習データなど）を公開し、推論中心の強力な基盤をコミュニティに提供することで、今後の研究と開発を支援する。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

2ヶ月前

監視付き微調整

データセット

AIインフラストラクチャ

アプローチ／フレームワーク

Zhengzhong Liu Liping Tang Linghao Jin Haonan Li Nikhil Ranjan Desai Fan Shaurya Rohatgi Richard Fan Omkar Pangarkar Huijuan Wang

概要

本稿では、一般のLLMが有する会話や知識検索などの機能に加え、推論適応のための優れた基盤として、完全に新規に構築された360度オープン型LLM「K2-V2」を紹介する。K2-V2は、同サイズクラスにおけるオープンウェイトモデルのリーダーと並ぶ強力な性能を発揮し、Qwen2.5-72Bを上回る性能を示し、Qwen3-235Bの水準に近づいている。本モデルは、学習プロセス全体にわたり、ドメイン知識、推論能力、長文対応、ツール利用機能を積極的に統合している。これにより、複雑な推論タスクに特化したモデルの構築が明示的に可能となる。単純な教師あり微調整（supervised fine-tuning）を用いてその可能性を実証し、高度なアライメント技術の発展に向けた大きな余地（headroom）を示す強力なベースラインを確立した。また、全学習履歴およびデータ構成を公開することで、継続的学習（continuous training）というオープンソース開発の重要なシナリオにおける効果を最大化した。本研究では、モデル重みおよびLLM360の特徴的なアーティファクト（完全な学習データなど）を公開し、推論中心の強力な基盤をコミュニティに提供することで、今後の研究と開発を支援する。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています