HyperAI
HyperAI
메인 페이지
홈
GPU
콘솔
문서
가격
Pulse
뉴스
리소스
논문
노트북
데이터 세트
위키
벤치마크
SOTA
LLM 모델
GPU 리더보드
커뮤니티
이벤트
유틸리티
검색
정보
서비스 이용약관
개인정보 처리방침
한국어
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
로그인
HyperAI
Papers
OctoThinker: 중간 훈련이 강화 학습 확장에 유리하게 작용함
Discord에서 논의하기
일 년 전
강화 학습
모델 훈련
데이터셋
요약
Paper
리소스
gair-nlp/octothinker
Official
pytorch
GAIR-NLP/OctoThinker
HyperAI
HyperAI
메인 페이지
홈
GPU
콘솔
문서
가격
Pulse
뉴스
리소스
논문
노트북
데이터 세트
위키
벤치마크
SOTA
LLM 모델
GPU 리더보드
커뮤니티
이벤트
유틸리티
검색
정보
서비스 이용약관
개인정보 처리방침
한국어
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
로그인
HyperAI
Papers
OctoThinker: 중간 훈련이 강화 학습 확장에 유리하게 작용함
Discord에서 논의하기
일 년 전
강화 학습
모델 훈련
데이터셋
요약
Paper
리소스
gair-nlp/octothinker
Official
pytorch
GAIR-NLP/OctoThinker
188
188
188
188