Command Palette
Search for a command to run...
Papers
최신 AI 트렌드를 파악할 수 있도록 매일 업데이트되는 최첨단 AI 연구 논문

ELF: 내장형 언어 흐름(Embedded Language Flows)

PaperFit: 과학적 문서를 위한 비전 기반 루프 타입셋팅 최적화































ELF: 내장형 언어 흐름(Embedded Language Flows)

PaperFit: 과학적 문서를 위한 비전 기반 루프 타입셋팅 최적화






























규칙 기반 온-폴리시 증류
CollabVR: Vision-Language 및 Video Generation Models을 활용한 협력적 비디오 추론
TMAS: 다중 에이전트 시너지를 통한 테스트 타임 컴퓨팅 확장
Soohak: LLM의 연구 수준의 수학 능력을 평가하기 위한 수학자가 선정한 벤치마크
Qwen-Image-2.0 기술 보고서
MiniCPM-o 4.5: 실시간 풀듀플렉스 오모모달 상호작용을 향하여
배치 중 학습: 일반화 로봇 정책에 대한 군집 규모 강화학습
Fast Byte Latent Transformer
AI 공동 수학자: 에이전트형 AI를 활용한 수학 연구 가속화
HyperEyes: 병렬 다중 모달 탐색 agent들을 위한 이층 세분화 효율성 인식 강화 학습
평균 모드 스크리밍: 1000-레이어 Diffusion Transformers에 대한 평균-분산 분할 잔여
LLMs가 LLMs를 개선하다: 테스트 시간 확장을 위한 Agentic 발견
리스트 와이즈 정책 최적화: LLM 응답 심플렉스에서의 목표 투영으로서 그룹 기반 RLVR
Flow-OPD: Flow Matching 모델을 위한 온-폴리시 디스틸레이션
MACE-Dance: 음악 기반 댄스 동영상 생성을 위한 모션-외관 연쇄 전문가
추론 집약적 검색 재고찰: 에이전트 검색 시스템에서의 검색기 평가 및 발전
상상에 대한 신뢰의 시기: 월드 액션 모델을 위한 적응형 액션 실행
SemEval-2026 Task 8의 RaguTeam: 신중한 다중 턴 응답 생성을 위한 판사가 주도하는 LLM agent 앙상블
MiA-Signature: 긴 문맥 이해를 위한 전역 활성화 근사
Continuous 잠재 확산 언어 모델
기술1: 강화 학습을 통한 기술 증강 에이전트의 통합적 진화
의미적 유사성을 넘어서: 직접 코퍼스 상호작용을 통한 에이전트 검색을 위한 검색 방식 재고찰
MathNet: 수학적 추론 및 검색을 위한 글로벌 다모달 벤치마크
D-OPSD: 연속적으로 튜닝된 Step-Distilled Diffusion Models를 위한 온-폴리시 자가 증류
ZAYA1-8B 기술 보고서
PhysForge: 상호작용 가능한 가상 세계를 위한 물리학 기반 3D 자산 생성
HERMES++: 3D 장면 이해 및 생성을 위한 통합 드라이빙 월드 모델의 실현
OpenSearch-VL: 최첨단 다중 모달 검색 에이전트를 위한 개방형 레시피
RLDX-1 기술 보고서
Stream-T1: 스트리밍 영상 생성을 위한 테스트 타임 스케일링
규칙 기반 온-폴리시 증류
CollabVR: Vision-Language 및 Video Generation Models을 활용한 협력적 비디오 추론
TMAS: 다중 에이전트 시너지를 통한 테스트 타임 컴퓨팅 확장
Soohak: LLM의 연구 수준의 수학 능력을 평가하기 위한 수학자가 선정한 벤치마크
Qwen-Image-2.0 기술 보고서
MiniCPM-o 4.5: 실시간 풀듀플렉스 오모모달 상호작용을 향하여
배치 중 학습: 일반화 로봇 정책에 대한 군집 규모 강화학습
Fast Byte Latent Transformer
AI 공동 수학자: 에이전트형 AI를 활용한 수학 연구 가속화
HyperEyes: 병렬 다중 모달 탐색 agent들을 위한 이층 세분화 효율성 인식 강화 학습
평균 모드 스크리밍: 1000-레이어 Diffusion Transformers에 대한 평균-분산 분할 잔여
LLMs가 LLMs를 개선하다: 테스트 시간 확장을 위한 Agentic 발견
리스트 와이즈 정책 최적화: LLM 응답 심플렉스에서의 목표 투영으로서 그룹 기반 RLVR
Flow-OPD: Flow Matching 모델을 위한 온-폴리시 디스틸레이션
MACE-Dance: 음악 기반 댄스 동영상 생성을 위한 모션-외관 연쇄 전문가
추론 집약적 검색 재고찰: 에이전트 검색 시스템에서의 검색기 평가 및 발전
상상에 대한 신뢰의 시기: 월드 액션 모델을 위한 적응형 액션 실행
SemEval-2026 Task 8의 RaguTeam: 신중한 다중 턴 응답 생성을 위한 판사가 주도하는 LLM agent 앙상블
MiA-Signature: 긴 문맥 이해를 위한 전역 활성화 근사
Continuous 잠재 확산 언어 모델
기술1: 강화 학습을 통한 기술 증강 에이전트의 통합적 진화
의미적 유사성을 넘어서: 직접 코퍼스 상호작용을 통한 에이전트 검색을 위한 검색 방식 재고찰
MathNet: 수학적 추론 및 검색을 위한 글로벌 다모달 벤치마크
D-OPSD: 연속적으로 튜닝된 Step-Distilled Diffusion Models를 위한 온-폴리시 자가 증류
ZAYA1-8B 기술 보고서
PhysForge: 상호작용 가능한 가상 세계를 위한 물리학 기반 3D 자산 생성
HERMES++: 3D 장면 이해 및 생성을 위한 통합 드라이빙 월드 모델의 실현
OpenSearch-VL: 최첨단 다중 모달 검색 에이전트를 위한 개방형 레시피
RLDX-1 기술 보고서
Stream-T1: 스트리밍 영상 생성을 위한 테스트 타임 스케일링