ERNIE-4.5-21B-A3B-Thinking: 軽量モデル推論機能のアップグレード

1. チュートリアルの概要

建てる

ERNIE-4.5-21B-A3B-Thinkingは、百度文心易言チームが2025年9月にリリースした軽量推論モデル「Thinking Edition」です。ERNIE-4.5-21B-A3B-Thinkingは、合計パラメータサイズが21BのMixture of Experts(MoE)アーキテクチャを採用しています。各トークンは3Bのパラメータをアクティブ化し、命令の微調整と強化学習によって学習されます。ERNIE-4.5-21B-A3B-Thinkingは、ERNIE-4.5-21B-A3Bをベースに学習された深層思考モデルです。128Kのコンテキストウィンドウをサポートし、長いコンテキストを必要とする複雑な推論タスクに適しています。このモデルは、論理的推論、数学、科学、コードおよびテキスト生成など、人間の専門家を必要とするタスクにおいて大幅な改善を実現するだけでなく、効率的なツール呼び出し機能を備え、複雑なタスクの自動処理をサポートできます。関連する論文結果は「ERNIE4.5 技術レポート”。

このチュートリアルで使用されるコンピューティング リソースは、単一の RTX A6000 カードです。

2. エフェクト表示

3. 操作手順

1. コンテナを起動します

「モデル」が表示されていない場合は、モデルが初期化中であることを意味します。モデルが大きいため、3〜4分ほど待ってページを更新してください。

2. 使用手順

4. 議論

🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。

引用情報

このプロジェクトの引用情報は次のとおりです。

@misc{ernie2025technicalreport,
      title={ERNIE 4.5 Technical Report},
      author={Baidu-ERNIE-Team},
      year={2025},
      primaryClass={cs.CL},
      howpublished={\url{https://ernie.baidu.com/blog/publication/ERNIE_Technical_Report.pdf}}
}