Command Palette
Search for a command to run...
Papers
최신 AI 트렌드를 파악할 수 있도록 매일 업데이트되는 최첨단 AI 연구 논문

큐트: 양자 네이티브 데이터베이스 지향

InnoEval: 연구 아이디어 평가를 지식 기반의 다중 관점 추론 문제로 본다































큐트: 양자 네이티브 데이터베이스 지향

InnoEval: 연구 아이디어 평가를 지식 기반의 다중 관점 추론 문제로 본다






























쿼리 앵커를 통한 시나리오 적응형 사용자 표현: 대규모 언어 모델을 통한 접근
SemanticMoments: 제3모멘트 특징을 통한 훈련 없이 구현하는 움직임 유사도
RLinf-Co: VLA 모델을 위한 강화학습 기반 시뮬레이션-현장 공동 훈련
ABot-M0: 동작 매니폴드 학습을 통한 로봇 조작을 위한 VLA 기초 모델
시각적 추론에 대해 RL은 무엇을 개선하는가? 프랑켄슈타인 스타일의 분석
메드시아오허: 의료용 MLLM을 구축하기 위한 포괄적인 레시피
줌(zoom) 없이 줌(zoom)하기: 세부적인 다중모달 인지 위한 영역-이미지 디스틸레이션
적은 것이 충분하다: LLM의 특징 공간에서 다양한 데이터 합성하기
GigaBrain-0.5M*: 세계 모델 기반 강화 학습에서 학습하는 VLA
MOSS-Audio-Tokenizer: 향후 오디오 기반 모델을 위한 오디오 토크나이저의 확장
학습의 경계를 교사 초월하기: 보상 외삽을 통한 일반화된 온폴리시 디스틸레이션
DeepGen 1.0: 이미지 생성 및 편집의 발전을 위한 경량 통합 다중모달 모델
Composition-RL: 대규모 언어 모델의 강화 학습을 위한 검증 가능한 프롬프트를 구성하세요
몰트북 뒤의 악마: 자가진화하는 AI 사회에서 안전성은 항상 사라지고 있다
자율 수학 연구로 나아가기
긴 컨텍스트 추론을 위한 게이트형 순환 기억: 언제 기억할 것인가, 언제 멈출 것인가
ASA: 도구 호출 도메인 적응을 위한 활성화 조정
PhyCritic: 물리 AI를 위한 다중 모달 비평가 모델
GENIUS: 생성형 유동지능 평가 세트
스텝 3.5 플래시: 11B 개의 액티브 파라미터를 활용한 오픈 프론티어 수준의 지능 열기
월드-VLA-루프: 비디오 월드 모델과 VLA 정책의 폐루프 학습
자율 수학 연구를 향하여
에이전트 월드 모델: 에이전트 기반 강화 학습을 위한 무한 합성 환경
P1-VL: 물리 올림피아드에서 시각 인지와 과학적 추론 연결하기
마인드셋의 사슬: 적응형 인지 모드를 통한 추론
UI-Venus-1.5 기술 보고서
Code2World: 렌더러블 코드 생성을 통한 GUI 월드 모델
OPUS: 대규모 언어 모델 사전 훈련에서 각 반복 단계마다 효율적이고 원칙적인 데이터 선택을 위한 방향성
BagelVLA: 시각-언어-행동 병행 생성을 통한 장기 지속 조작 성능 향상
THINGS-data: 인간의 뇌와 행동 내 객체 표상(object representations) 조사를 위한 대규모 멀티모달 데이터셋 컬렉션
쿼리 앵커를 통한 시나리오 적응형 사용자 표현: 대규모 언어 모델을 통한 접근
SemanticMoments: 제3모멘트 특징을 통한 훈련 없이 구현하는 움직임 유사도
RLinf-Co: VLA 모델을 위한 강화학습 기반 시뮬레이션-현장 공동 훈련
ABot-M0: 동작 매니폴드 학습을 통한 로봇 조작을 위한 VLA 기초 모델
시각적 추론에 대해 RL은 무엇을 개선하는가? 프랑켄슈타인 스타일의 분석
메드시아오허: 의료용 MLLM을 구축하기 위한 포괄적인 레시피
줌(zoom) 없이 줌(zoom)하기: 세부적인 다중모달 인지 위한 영역-이미지 디스틸레이션
적은 것이 충분하다: LLM의 특징 공간에서 다양한 데이터 합성하기
GigaBrain-0.5M*: 세계 모델 기반 강화 학습에서 학습하는 VLA
MOSS-Audio-Tokenizer: 향후 오디오 기반 모델을 위한 오디오 토크나이저의 확장
학습의 경계를 교사 초월하기: 보상 외삽을 통한 일반화된 온폴리시 디스틸레이션
DeepGen 1.0: 이미지 생성 및 편집의 발전을 위한 경량 통합 다중모달 모델
Composition-RL: 대규모 언어 모델의 강화 학습을 위한 검증 가능한 프롬프트를 구성하세요
몰트북 뒤의 악마: 자가진화하는 AI 사회에서 안전성은 항상 사라지고 있다
자율 수학 연구로 나아가기
긴 컨텍스트 추론을 위한 게이트형 순환 기억: 언제 기억할 것인가, 언제 멈출 것인가
ASA: 도구 호출 도메인 적응을 위한 활성화 조정
PhyCritic: 물리 AI를 위한 다중 모달 비평가 모델
GENIUS: 생성형 유동지능 평가 세트
스텝 3.5 플래시: 11B 개의 액티브 파라미터를 활용한 오픈 프론티어 수준의 지능 열기
월드-VLA-루프: 비디오 월드 모델과 VLA 정책의 폐루프 학습
자율 수학 연구를 향하여
에이전트 월드 모델: 에이전트 기반 강화 학습을 위한 무한 합성 환경
P1-VL: 물리 올림피아드에서 시각 인지와 과학적 추론 연결하기
마인드셋의 사슬: 적응형 인지 모드를 통한 추론
UI-Venus-1.5 기술 보고서
Code2World: 렌더러블 코드 생성을 통한 GUI 월드 모델
OPUS: 대규모 언어 모델 사전 훈련에서 각 반복 단계마다 효율적이고 원칙적인 데이터 선택을 위한 방향성
BagelVLA: 시각-언어-행동 병행 생성을 통한 장기 지속 조작 성능 향상
THINGS-data: 인간의 뇌와 행동 내 객체 표상(object representations) 조사를 위한 대규모 멀티모달 데이터셋 컬렉션