HyperAIHyperAI

Command Palette

Search for a command to run...

ERNIE-4.5-21B-A3B-Thinking: 경량 모델 추론 기능 업그레이드

날짜

8달 전

태그

논문 URL

ernie.baidu.com

라이선스

Apache 2.0

GPU 컴퓨팅 에어드롭

단 20시간의 RTX 5090 컴퓨팅 리소스 $1 (가치 $7)
지금 사용하기

1. 튜토리얼 소개

짓다

ERNIE-4.5-21B-A3B-Thinking은 2025년 9월 바이두 문신이옌(Baidu Wenxin Yiyan) 팀에서 출시한 경량 추론 모델인 "사고 에디션(Thinking Edition)"입니다. ERNIE-4.5-21B-A3B-Thinking은 총 파라미터 크기가 21B인 하이브리드 전문가(MoE) 아키텍처를 사용합니다. 각 토큰은 3B개의 파라미터를 활성화하며, 명령어 미세 조정과 강화 학습을 통해 학습됩니다. ERNIE-4.5-21B-A3B-Thinking은 ERNIE-4.5-21B-A3B를 기반으로 학습된 심층 사고 모델로, 128K 컨텍스트 윈도우를 지원하여 긴 컨텍스트를 요구하는 복잡한 추론 작업에 적합합니다. 이 모델은 논리 추론, 수학, 과학, 코드 및 텍스트 생성과 같이 인간 전문가가 필요한 작업에서 상당한 성능 향상을 보여줄 뿐만 아니라 효율적인 도구 호출 기능을 통해 복잡한 작업의 자동 처리를 지원합니다. 관련 연구 논문은 검색 가능합니다. ERNIE4.5 기술 보고서 .

이 튜토리얼에서 사용된 컴퓨팅 리소스는 RTX A6000 카드 1개입니다.

2. 효과 표시

3. 작업 단계

1. 컨테이너를 시작하세요

"모델"이 표시되지 않으면 모델이 초기화되고 있음을 의미합니다. 모델이 크기 때문에 약 3~4분 정도 기다리신 후 페이지를 새로고침해 주시기 바랍니다.

2. 사용 단계

4. 토론

🖌️ 고품질 프로젝트를 발견하시면, 백그라운드에 메시지를 남겨 추천해주세요! 또한, 튜토리얼 교환 그룹도 만들었습니다. 친구들의 QR코드 스캔과 [SD 튜토리얼] 댓글을 통해 그룹에 가입하여 다양한 기술 이슈에 대해 논의하고 신청 결과를 공유해 주시기 바랍니다.↓

인용 정보

이 프로젝트에 대한 인용 정보는 다음과 같습니다.

@misc{ernie2025technicalreport,
      title={ERNIE 4.5 Technical Report},
      author={Baidu-ERNIE-Team},
      year={2025},
      primaryClass={cs.CL},
      howpublished={\url{https://ernie.baidu.com/blog/publication/ERNIE_Technical_Report.pdf}}
}

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp