HyperAI超神経

Mellum-4b-baseはコード補完用に設計されたモデルです

1. チュートリアルの概要

Mellum-4b-base は、コードの理解、生成、最適化タスク向けに設計された、JetBrains が 2025 年 4 月 29 日にリリースしたオープンソースの大規模言語モデル (LLM) です。このモデルは、ソフトウェア開発プロセス全体で優れた機能を発揮し、AI 強化プログラミング、インテリジェント IDE 統合、教育ツール開発、コード研究などのシナリオに適しています。

このチュートリアルでは、リソースとして単一の RTX 4090 カードを使用し、モデルはコードの最適化にのみ使用されます。

2. プロジェクト例

3. 操作手順

1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

「Bad Gateway」と表示される場合、モデルが初期化中であることを意味します。モデルが大きいため、1〜2分ほど待ってページを更新してください。

2. Web ページに入ると、モデルと会話を開始できます。

利用手順

4. 議論

🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。

引用情報

このプロジェクトの引用情報は次のとおりです。

@misc{Mellum-4b-base,
  title= {Mellum-4b-base},
  author= {Pavlichenko, Nikita and Nazarov, Iurii and Dolgov, Ivan and Garanina, Ekaterina and Lasocki, Karol and Reshetnikova, Julia and Boitsov, Sergei and Bondyrev, Ivan and Karaeva, Dariia and Sheptyakov, Maksim and Ustalov, Dmitry and Mukhin, Artem and Proshev, Semyon and Abramov, Nikita and Kolomyttseva, Olga and Lysaniuk, Kseniia and Zavidnyi, Ilia and Semenkin, Anton and Tankov, Vladislav and Sazanovich, Uladzislau},
  year= {2025},
}