vLLM + Open WebUIを使用してEXAONE-4.0-32Bをデプロイする
1. チュートリアルの概要

EXAONE-4.0は、韓国のLG AI研究所が2025年7月15日に発表した新世代のハイブリッド推論AIモデルです。韓国初のハイブリッド推論AIモデルでもあります。このモデルは、一般的な自然言語処理能力とEXAONE Deepによって検証された高度な推論能力を組み合わせ、数学、科学、プログラミングなどの難解な分野で画期的な成果を上げています。MCPと関数呼び出し機能をサポートし、エージェントAIの技術的基盤を提供します。同社が発表した32Bプロフェッショナルモデルは、6つの国家資格筆記試験に合格しており、最新のグローバル高難度ベンチマークテストのスコアは以下の通りです。知識推論:MMLU-Pro 81.8点、プログラミング能力:LiveCodeBench v6 66.7点、科学リテラシー:GPQA-Diamond 75.4点、数学能力:AIME 2025 85.3点。関連論文の結果は以下の通りです。EXAONE 4.0: 非推論モードと推論モードを統合した統合大規模言語モデル”。
このチュートリアルでは、デュアル SIM A6000 のリソースを使用します。
2. プロジェクト例
1. 思考モードをオフにする

2. 思考モードを開始する

3. 操作手順
1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

2. Web ページに入ると、モデルと会話を開始できます。
「モデル」が表示されない場合は、モデルが初期化中です。モデルのサイズが大きいため、2~3分ほどお待ちいただき、ページを更新してください。
利用手順

4. 議論
🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。

引用情報
このプロジェクトの引用情報は次のとおりです。
@article{exaone-4.0,
title={EXAONE 4.0: Unified Large Language Models Integrating Non-reasoning and Reasoning Modes},
author={{LG AI Research}},
journal={arXiv preprint arXiv:2507.11407},
year={2025}
}