4ヶ月前

モデル学習

アプローチ／フレームワーク

Ling Team Bin Han Caizhi Tang Chen Liang Donghao Zhang Fan Yuan Feng Zhu Jie Gao Jingyu Hu Longfei Li

概要

本技術報告では、Ring-linearモデルシリーズを紹介する。具体的には、Ring-mini-linear-2.0とRing-flash-linear-2.0の2モデルを含む。Ring-mini-linear-2.0は160億パラメータ、9.57億アクティベーションを有し、Ring-flash-linear-2.0は1040億パラメータ、61億アクティベーションを有する。両モデルは、線形アテンション（linear attention）とソフトマックスアテンション（softmax attention）を効果的に統合するハイブリッドアーキテクチャを採用しており、長文文脈における推論処理においてI/Oおよび計算オーバーヘッドを顕著に低減している。320億パラメータの密接型（dense）モデルと比較して、本シリーズは推論コストを1/10まで削減し、従来のRingシリーズと比較しても50%以上のコスト低減を達成している。さらに、ハイブリッドアーキテクチャにおける異なるアテンションメカニズムの比率を体系的に検証した結果、現在の最適なモデル構造を同定した。また、自社開発の高性能FP8演算子ライブラリ「linghe」を活用することで、全体的な学習効率が50%向上した。訓練と推論エンジンの演算子間の高い整合性により、強化学習段階において長期間にわたり安定的かつ高効率な最適化が可能となり、複数の難解な複雑推論ベンチマークにおいて一貫してSOTA（State-of-the-Art）性能を維持している。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

4ヶ月前

モデル学習

アプローチ／フレームワーク

Ling Team Bin Han Caizhi Tang Chen Liang Donghao Zhang Fan Yuan Feng Zhu Jie Gao Jingyu Hu Longfei Li

概要

本技術報告では、Ring-linearモデルシリーズを紹介する。具体的には、Ring-mini-linear-2.0とRing-flash-linear-2.0の2モデルを含む。Ring-mini-linear-2.0は160億パラメータ、9.57億アクティベーションを有し、Ring-flash-linear-2.0は1040億パラメータ、61億アクティベーションを有する。両モデルは、線形アテンション（linear attention）とソフトマックスアテンション（softmax attention）を効果的に統合するハイブリッドアーキテクチャを採用しており、長文文脈における推論処理においてI/Oおよび計算オーバーヘッドを顕著に低減している。320億パラメータの密接型（dense）モデルと比較して、本シリーズは推論コストを1/10まで削減し、従来のRingシリーズと比較しても50%以上のコスト低減を達成している。さらに、ハイブリッドアーキテクチャにおける異なるアテンションメカニズムの比率を体系的に検証した結果、現在の最適なモデル構造を同定した。また、自社開発の高性能FP8演算子ライブラリ「linghe」を活用することで、全体的な学習効率が50%向上した。訓練と推論エンジンの演算子間の高い整合性により、強化学習段階において長期間にわたり安定的かつ高効率な最適化が可能となり、複数の難解な複雑推論ベンチマークにおいて一貫してSOTA（State-of-the-Art）性能を維持している。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

すべての注目は重要である：長文脈推論のための効率的なハイブリッドアーキテクチャ | 記事 | HyperAI超神経