Command Palette
Search for a command to run...
Papers
최신 AI 트렌드를 파악할 수 있도록 매일 업데이트되는 최첨단 AI 연구 논문

UniVA: 오픈소스 다음 세대 비디오 종합 모델을 위한 유니버설 비디오 에이전트

PAN: 일반적이고 상호작용 가능하며 장기적인 시계열 세계 시뮬레이션을 위한 월드 모델































UniVA: 오픈소스 다음 세대 비디오 종합 모델을 위한 유니버설 비디오 에이전트

PAN: 일반적이고 상호작용 가능하며 장기적인 시계열 세계 시뮬레이션을 위한 월드 모델






























잠재 공간에서의 한 걸음, 픽셀 공간에서의 거대한 도약: 당신의 확산 모델을 위한 빠른 잠재 크기 확대 어댑터
YOLOv13: 고차원 그래프 기반 적응형 시각 인지 강화를 통한 실시간 객체 탐지
MonkeyOCR: 구조 인식 관계 삼중체 패러다임을 활용한 문서 파싱
안전한 생성형 AI를 위한 공감대 샘플링
아르거스: 엔드투엔드 자율주행시스템을 위한 회복력 기반 안전 보장 프레임워크
WMPO: 시각-언어-행동 모델을 위한 세계 모델 기반 정책 최적화
LoopTool: 견고한 LLM 도구 호출을 위한 데이터-학습 루프 닫기
사실 검색을 넘어서: 생성적 의미 워크스페이스를 통한 RAG의 에피소딕 기억
TiDAR: 확산에서 생각하고, 자동 회귀적으로 말하기
타임투무브: 이중클록 노이즈 제거를 통한 훈련 없이 움직임을 제어하는 비디오 생성
루미네: 3D 오픈 월드에서 일반화 에이전트를 구축하기 위한 오픈 레시피
1,000단어에서 이미지 생성하기: 구조화된 캡션을 통한 텍스트-이미지 생성 향상
KLASS: KL을 통한 마스크된 확산 모델에서의 빠른 추론
사람의 시연에 기반한 컴퓨터 사용 에이전트 구축
Wasm: 구조화된 아랍어 혼합 다중모달 코퍼스를 구축하기 위한 파이프라인
대화 시스템에서의 적응형 다중 에이전트 응답 정제
SPAN: 단안 3차원 객체 탐지를 위한 공간 투영 정렬
고차원 시스템에 대한 볼테라 급수의 효율적 근사
SofT-GRPO: 이산 토큰 기반 LLM 강화학습을 초월하는 구름벨 재파라미터화 소프트사고 정책 최적화
레드원 2.0: 소셜 네트워킹 서비스에서 도메인 특화 LLM 후학습의 재고
스테이션: 인공지능 기반 탐구를 위한 오픈월드 환경
DRIVE: 경쟁적 코드 생성에서 검증 가능한 보상과 함께 강화 학습을 위한 데이터 쿠레이션 최적 실천 방안
IterResearch: 마코비안 상태 재구성에 의한 장기 수평 에이전트의 재고찰
HaluMem: 에이전트의 메모리 시스템에서의 환각 평가
GVPO: 그룹 분산 정책 최적화를 활용한 대규모 언어 모델 후기학습
ReCA: 실시간이고 효율적인 협업 몸체형 자율 에이전트를 위한 통합 가속 기법
DexFlyWheel: 민첩한 조작을 위한 확장 가능하고 자가 개선형 데이터 생성 프레임워크
노바플로우: 생성된 비디오에서 도출된 실행 가능한 플로우를 통한 제로샷 조작
TreeSynth: 트리 가이드 서브스페이스 분할을 통한 스크래치 기반 다양한 데이터 합성
GTA: 대규모 언어 모델을 활용한 텍스트 분류를 위한 감독 지도형 강화 학습
잠재 공간에서의 한 걸음, 픽셀 공간에서의 거대한 도약: 당신의 확산 모델을 위한 빠른 잠재 크기 확대 어댑터
YOLOv13: 고차원 그래프 기반 적응형 시각 인지 강화를 통한 실시간 객체 탐지
MonkeyOCR: 구조 인식 관계 삼중체 패러다임을 활용한 문서 파싱
안전한 생성형 AI를 위한 공감대 샘플링
아르거스: 엔드투엔드 자율주행시스템을 위한 회복력 기반 안전 보장 프레임워크
WMPO: 시각-언어-행동 모델을 위한 세계 모델 기반 정책 최적화
LoopTool: 견고한 LLM 도구 호출을 위한 데이터-학습 루프 닫기
사실 검색을 넘어서: 생성적 의미 워크스페이스를 통한 RAG의 에피소딕 기억
TiDAR: 확산에서 생각하고, 자동 회귀적으로 말하기
타임투무브: 이중클록 노이즈 제거를 통한 훈련 없이 움직임을 제어하는 비디오 생성
루미네: 3D 오픈 월드에서 일반화 에이전트를 구축하기 위한 오픈 레시피
1,000단어에서 이미지 생성하기: 구조화된 캡션을 통한 텍스트-이미지 생성 향상
KLASS: KL을 통한 마스크된 확산 모델에서의 빠른 추론
사람의 시연에 기반한 컴퓨터 사용 에이전트 구축
Wasm: 구조화된 아랍어 혼합 다중모달 코퍼스를 구축하기 위한 파이프라인
대화 시스템에서의 적응형 다중 에이전트 응답 정제
SPAN: 단안 3차원 객체 탐지를 위한 공간 투영 정렬
고차원 시스템에 대한 볼테라 급수의 효율적 근사
SofT-GRPO: 이산 토큰 기반 LLM 강화학습을 초월하는 구름벨 재파라미터화 소프트사고 정책 최적화
레드원 2.0: 소셜 네트워킹 서비스에서 도메인 특화 LLM 후학습의 재고
스테이션: 인공지능 기반 탐구를 위한 오픈월드 환경
DRIVE: 경쟁적 코드 생성에서 검증 가능한 보상과 함께 강화 학습을 위한 데이터 쿠레이션 최적 실천 방안
IterResearch: 마코비안 상태 재구성에 의한 장기 수평 에이전트의 재고찰
HaluMem: 에이전트의 메모리 시스템에서의 환각 평가
GVPO: 그룹 분산 정책 최적화를 활용한 대규모 언어 모델 후기학습
ReCA: 실시간이고 효율적인 협업 몸체형 자율 에이전트를 위한 통합 가속 기법
DexFlyWheel: 민첩한 조작을 위한 확장 가능하고 자가 개선형 데이터 생성 프레임워크
노바플로우: 생성된 비디오에서 도출된 실행 가능한 플로우를 통한 제로샷 조작
TreeSynth: 트리 가이드 서브스페이스 분할을 통한 스크래치 기반 다양한 데이터 합성
GTA: 대규모 언어 모델을 활용한 텍스트 분류를 위한 감독 지도형 강화 학습