HyperAIHyperAI

Command Palette

Search for a command to run...

Magistral この単語は、学術的な文脈では「権威ある」や「卓越した」といった意味で使用されます。ただし、具体的な文脈がないと正確な翻訳が難しいため、以下に一般的な翻訳を示します。 権威ある 卓越した もし特定の文脈がある場合は、その情報を提供いただければより適切な翻訳が可能です。

概要

私たちはMagistralを紹介します。これはMistralの最初の推論モデルであり、また私たち自身が開発したスケーラブルな強化学習(Reinforcement Learning: RL)パイプラインです。既存の実装や以前のモデルから抽出されたRLトレースに依存するのではなく、自社のモデルとインフラストラクチャのみを使用して、一からアプローチを行いました。特に、このスタックにより、LLM(大規模言語モデル)の純粋なRL訓練の限界を探る機会を得ました。また、モデルの推論言語を強制するための単純な方法を提示し、テキストデータのみでのRLが初期チェックポイントの大半の機能を維持することを示しています。テキストデータでのRLは、マルチモーダル理解、指示追従、関数呼び出しにおいて性能を維持または向上させることを見出しました。Magistral Mediumは、Mistral Medium 3上での推論に特化してRLのみで訓練されたモデルであり、さらにApache 2.0ライセンスのもとでオープンソース化されたMagistral Smallには、Magistral Mediumからのコールドスタートデータが含まれています。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています