HyperAIHyperAI

Command Palette

Search for a command to run...

ERNIE-4.5-21B-A3B-Thinking: 軽量モデル推論機能のアップグレード

Date

4ヶ月前

Size

16.36 MB

Tags

License

Apache 2.0

1. チュートリアルの概要

建てる

ERNIE-4.5-21B-A3B-Thinkingは、Baidu Wenxin Yiyanチームが2025年9月にリリースした軽量推論モデル「Thinking Edition」です。ERNIE-4.5-21B-A3B-Thinkingは、総パラメータサイズ21Bのハイブリッドエキスパート(MoE)アーキテクチャを採用しています。各トークンは3Bのパラメータをアクティブ化し、命令の微調整と強化学習によって学習されます。ERNIE-4.5-21B-A3B-Thinkingは、ERNIE-4.5-21B-A3Bをベースに学習されたディープシンキングモデルで、128Kのコンテキストウィンドウをサポートし、長いコンテキストを必要とする複雑な推論タスクに適しています。このモデルは、論理的推論、数学、科学、コードおよびテキスト生成など、人間の専門家を必要とするタスクにおいて大幅な改善を実現するだけでなく、効率的なツール呼び出し機能を備えており、複雑なタスクの自動処理をサポートします。関連研究論文も公開されています。 ERNIE4.5 技術レポート

このチュートリアルで使用されるコンピューティング リソースは、単一の RTX A6000 カードです。

2. エフェクト表示

3. 操作手順

1. コンテナを起動します

「モデル」が表示されていない場合は、モデルが初期化中であることを意味します。モデルが大きいため、3〜4分ほど待ってページを更新してください。

2. 使用手順

4. 議論

🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。

引用情報

このプロジェクトの引用情報は次のとおりです。

@misc{ernie2025technicalreport,
      title={ERNIE 4.5 Technical Report},
      author={Baidu-ERNIE-Team},
      year={2025},
      primaryClass={cs.CL},
      howpublished={\url{https://ernie.baidu.com/blog/publication/ERNIE_Technical_Report.pdf}}
}

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています