Magistral この単語は、学術的な文脈では「権威ある」や「卓越した」といった意味で使用されます。ただし、具体的な文脈がないと正確な翻訳が難しいため、以下に一般的な翻訳を示します。 権威ある 卓越した もし特定の文脈がある場合は、その情報を提供いただければより適切な翻訳が可能です。
Mistral-AI, Abhinav Rastogi, Albert Q. Jiang, Andy Lo, Gabrielle Berrada, Guillaume Lample, Jason Rute, Joep Barmentlo, Karmesh Yadav, Kartik Khandelwal, Khyathi Raghavi Chandu, Léonard Blier, Lucile Saulnier, Matthieu Dinot, Maxime Darrin, Neha Gupta, Roman Soletskyi, Sagar Vaze, Teven Le Scao, Yihan Wang, Adam Yang, Alexander H. Liu, Alexandre Sablayrolles, Amélie Héliou, Amélie Martin, Andy Ehrenberg, Anmol Agarwal, Antoine Roux, Arthur Darcet, Arthur Mensch, Baptiste Bout, Baptiste Rozière, Baudouin De Monicault, Chris Bamford, Christian Wallenwein, Christophe Renaudin, Clémence Lanfranchi, Darius Dabert, Devon Mizelle, Diego de las Casas, Elliot Chane-Sane, Emilien Fugier, Emma Bou Hanna, Gauthier Delerce, Gauthier Guinet, Georgii Novikov, Guillaume Martin, Himanshu Jaju, Jan Ludziejewski, Jean-Hadrien Chabran, Jean-Malo Delignon, Joachim Studnia, Jonas Amar, Josselin Somerville Roberts, Julien Denize, Karan Saxena, Kush Jain, Lingxiao Zhao, Louis Martin, Luyu Gao, Lélio Renard Lavaud, Marie Pellat, Mathilde Guillaumin, Mathis Felardos, Maximilian Augustin, Mickaël Seznec, Nikhil Raghuraman, Olivier Duchenne, Patricia Wang, Patrick von Platen, Patryk Saffer, Paul Jacob, Paul Wambergue, Paula Kurylowicz, Pavankumar Reddy Muddireddy, Philomène Chagniot, Pierre Stock, Pravesh Agrawal, Romain Sauvestre, Rémi Delacourt, Sanchit Gandhi, Sandeep Subramanian, Shashwat Dalal, Siddharth Gandhi, Soham Ghosh, Srijan Mishra, Sumukh Aithal, Szymon Antoniak, Thibault Schueller, Thibaut Lavril, Thomas Robert, Thomas Wang, Timothée Lacroix, Valeriia Nemychnikova, Victor Paltz, Virgile Richard, Wen-Ding Li, William Marshall, Xuanyu Zhang, Yunhao Tang
公開日: 6/15/2025

要約
私たちはMagistralを紹介します。これはMistralの最初の推論モデルであり、また私たち自身が開発したスケーラブルな強化学習(Reinforcement Learning: RL)パイプラインです。既存の実装や以前のモデルから抽出されたRLトレースに依存するのではなく、自社のモデルとインフラストラクチャのみを使用して、一からアプローチを行いました。特に、このスタックにより、LLM(大規模言語モデル)の純粋なRL訓練の限界を探る機会を得ました。また、モデルの推論言語を強制するための単純な方法を提示し、テキストデータのみでのRLが初期チェックポイントの大半の機能を維持することを示しています。テキストデータでのRLは、マルチモーダル理解、指示追従、関数呼び出しにおいて性能を維持または向上させることを見出しました。Magistral Mediumは、Mistral Medium 3上での推論に特化してRLのみで訓練されたモデルであり、さらにApache 2.0ライセンスのもとでオープンソース化されたMagistral Smallには、Magistral Mediumからのコールドスタートデータが含まれています。