vLLM + Open WebUI를 사용하여 EXAONE-4.0-32B 배포
1. 튜토리얼 소개

EXAONE-4.0은 LG AI 연구원이 2025년 7월 15일 한국에서 출시한 차세대 하이브리드 추론 AI 모델입니다. 또한 국내 최초의 하이브리드 추론 AI 모델이기도 합니다. 이 모델은 일반적인 자연어 처리 능력과 EXAONE Deep에서 검증된 고급 추론 능력을 결합하여 수학, 과학, 프로그래밍과 같은 난해한 분야에서 획기적인 성과를 달성합니다. MCP 및 함수 호출 함수를 지원하여 Agentic AI의 기술적 기반을 제공합니다. 출시된 32B 전문가 모델은 6개의 국가 전문 자격증 필기 시험을 통과했으며, 최신 글로벌 고난이도 벤치마크 테스트 점수는 다음과 같습니다. 지식 추론: MMLU-Pro 81.8점, 프로그래밍 능력: LiveCodeBench v6 66.7점, 과학적 소양: GPQA-Diamond 75.4점, 수학 능력: AIME 2025 85.3점. 관련 논문 결과는 "EXAONE 4.0: 비추론 및 추론 모드를 통합한 통합 대규모 언어 모델".
이 튜토리얼에서는 듀얼 SIM A6000의 리소스를 사용합니다.
2. 프로젝트 예시
1. 생각모드를 끄세요

2. 생각모드 시작

3. 작업 단계
1. 컨테이너 시작 후 API 주소를 클릭하여 웹 인터페이스로 진입합니다.

2. 웹페이지에 접속 후 모델과 대화를 시작할 수 있습니다.
"모델"이 표시되지 않으면 모델이 초기화 중임을 의미합니다. 모델이 용량이 크므로 2~3분 정도 기다린 후 페이지를 새로고침해 주세요.
사용 방법

4. 토론
🖌️ 고품질 프로젝트를 발견하시면, 백그라운드에 메시지를 남겨 추천해주세요! 또한, 튜토리얼 교환 그룹도 만들었습니다. 친구들의 QR코드 스캔과 [SD 튜토리얼] 댓글을 통해 그룹에 가입하여 다양한 기술 이슈에 대해 논의하고 신청 결과를 공유해 주시기 바랍니다.↓

인용 정보
이 프로젝트에 대한 인용 정보는 다음과 같습니다.
@article{exaone-4.0,
title={EXAONE 4.0: Unified Large Language Models Integrating Non-reasoning and Reasoning Modes},
author={{LG AI Research}},
journal={arXiv preprint arXiv:2507.11407},
year={2025}
}