ERNIE-4.5-21B-A3B-Thinking: 경량 모델 추론 기능 업그레이드
1. 튜토리얼 소개

ERNIE-4.5-21B-A3B-Thinking은 바이두 원신 이얀(Baidu Wenxin Yiyan) 팀이 2025년 9월에 출시한 경량 추론 모델 "Thinking Edition"입니다. ERNIE-4.5-21B-A3B-Thinking은 총 매개변수 크기가 21B인 전문가 혼합(MoE) 아키텍처를 채택합니다. 각 토큰은 3B 매개변수를 활성화하고 명령어 미세 조정 및 강화 학습을 통해 학습됩니다. ERNIE-4.5-21B-A3B-Thinking은 ERNIE-4.5-21B-A3B를 기반으로 학습된 심층 사고 모델입니다. 128K의 컨텍스트 윈도우를 지원하며 긴 컨텍스트가 필요한 복잡한 추론 작업에 적합합니다. 이 모델은 논리적 추론, 수학, 과학, 코드 및 텍스트 생성과 같이 인간 전문가가 필요한 작업에서 상당한 개선을 달성할 뿐만 아니라 효율적인 도구 호출 기능을 갖추고 있어 복잡한 작업의 자동화된 처리를 지원할 수 있습니다. 관련 논문 결과는 다음과 같습니다.ERNIE4.5 기술 보고서".
이 튜토리얼에서 사용된 컴퓨팅 리소스는 RTX A6000 카드 1개입니다.
2. 효과 표시

3. 작업 단계
1. 컨테이너를 시작하세요
"모델"이 표시되지 않으면 모델이 초기화되고 있음을 의미합니다. 모델이 크기 때문에 약 3~4분 정도 기다리신 후 페이지를 새로고침해 주시기 바랍니다.

2. 사용 단계

4. 토론
🖌️ 고품질 프로젝트를 발견하시면, 백그라운드에 메시지를 남겨 추천해주세요! 또한, 튜토리얼 교환 그룹도 만들었습니다. 친구들의 QR코드 스캔과 [SD 튜토리얼] 댓글을 통해 그룹에 가입하여 다양한 기술 이슈에 대해 논의하고 신청 결과를 공유해 주시기 바랍니다.↓

인용 정보
이 프로젝트에 대한 인용 정보는 다음과 같습니다.
@misc{ernie2025technicalreport,
title={ERNIE 4.5 Technical Report},
author={Baidu-ERNIE-Team},
year={2025},
primaryClass={cs.CL},
howpublished={\url{https://ernie.baidu.com/blog/publication/ERNIE_Technical_Report.pdf}}
}