Command Palette
Search for a command to run...
Papers
최신 AI 트렌드를 파악할 수 있도록 매일 업데이트되는 최첨단 AI 연구 논문

Wan-Move: 잠재 경로 안내를 통한 운동 제어 가능한 비디오 생성

소프트 적응형 정책 최적화































Wan-Move: 잠재 경로 안내를 통한 운동 제어 가능한 비디오 생성

소프트 적응형 정책 최적화






























스케일링 제로샷 참조-비디오 생성
Voxify3D: 픽셀 아트가 볼륨 렌더링과 만난다
DoVer: LLM 다중 에이전트 시스템을 위한 개입 지향 자동 디버깅
시계적 추론기를 활용한 통합 영상 편집
실제를 넘어서: 장문맥 LLM을 위한 회전 위치 임베딩의 상상적 확장
내재적 병렬 추론기: 자기 휘발성 강화 학습을 통한 병렬 추론
iSeal: 신뢰성 있는 LLM 소유권 검증을 위한 암호화된 지문 기술
DAVSP: 대규모 비전-언어 모델을 위한 깊이 있는 시각적 안전 프롬프트를 통한 안전성 정렬
월드젠: 텍스트에서 탐색 가능하고 상호작용 가능한 3D 세계로
서퍼모델: 간단한 산술이 최첨단 LLM 성능을 여는 비결
DTS: 추론 트리 스케치를 통한 대규모 추론 모델의 성능 향상
LLM을 활용한 베이지안 최적화를 위한 적응형 커널 설계는 케이크 조각처럼 간단하다
DePass: 간단한 분해된 전방 전파를 통한 통합적 특성 할당
COOPER: 공간 지능에서 협업적 인식과 추론을 위한 통합 모델
모방에서 구분으로: 다영역 추론 과제를 향상시키는 일반화된 커리큘럼 우위 메커니즘으로
PaCo-RL: 쌍별 보상 모델링을 통한 일관성 있는 이미지 생성을 위한 강화 학습의 발전
EMMA: 통합 아키텍처를 활용한 효율적인 다중모달 이해, 생성 및 편집
EditThinker: 모든 이미지 편집기에서 반복적 추론을 해제하기
TwinFlow: 자기적대적 흐름을 활용한 대규모 모델에서의 원스텝 생성 구현
CARE-PD: 파킨슨병 걸음걸이 평가를 위한 다기관 익명화 임상 데이터셋
웨넷스피치천: 방언 음성 처리를 위한 풍부한 주석을 갖춘 대규모 쓰촨어 어말집
PolypSense3D: 내시경에서 깊이 인지 기반 폴립 크기 측정을 위한 다중 소스 벤치마크 데이터셋
PhysDrive: 차량 내 운전자 모니터링을 위한 다중모달 원격 생리측정 데이터셋
인공 혼합정신: 언어 모델의 열린 경계 없는 동질성(그 이상까지)
오미니SVG: 통합적 확장 가능한 벡터 그래픽스 생성 모델
알고리즘적 사고 이론
로봇 월드 모델: 로봇 공학에서 강건한 정책 최적화를 위한 신경망 시뮬레이터
리워드 포싱: 보상 분포 매칭 디스틸레이션을 통한 효율적인 스트리밍 비디오 생성
의미론이 길을 제시한다: 비동기 잠재 확산을 통한 의미론적 및 텍스처 모델링의 조화
ARM-Thinker: 에이전트 기반 도구 사용과 시각적 추론을 통한 다중모달 생성 보상 모델 강화
스케일링 제로샷 참조-비디오 생성
Voxify3D: 픽셀 아트가 볼륨 렌더링과 만난다
DoVer: LLM 다중 에이전트 시스템을 위한 개입 지향 자동 디버깅
시계적 추론기를 활용한 통합 영상 편집
실제를 넘어서: 장문맥 LLM을 위한 회전 위치 임베딩의 상상적 확장
내재적 병렬 추론기: 자기 휘발성 강화 학습을 통한 병렬 추론
iSeal: 신뢰성 있는 LLM 소유권 검증을 위한 암호화된 지문 기술
DAVSP: 대규모 비전-언어 모델을 위한 깊이 있는 시각적 안전 프롬프트를 통한 안전성 정렬
월드젠: 텍스트에서 탐색 가능하고 상호작용 가능한 3D 세계로
서퍼모델: 간단한 산술이 최첨단 LLM 성능을 여는 비결
DTS: 추론 트리 스케치를 통한 대규모 추론 모델의 성능 향상
LLM을 활용한 베이지안 최적화를 위한 적응형 커널 설계는 케이크 조각처럼 간단하다
DePass: 간단한 분해된 전방 전파를 통한 통합적 특성 할당
COOPER: 공간 지능에서 협업적 인식과 추론을 위한 통합 모델
모방에서 구분으로: 다영역 추론 과제를 향상시키는 일반화된 커리큘럼 우위 메커니즘으로
PaCo-RL: 쌍별 보상 모델링을 통한 일관성 있는 이미지 생성을 위한 강화 학습의 발전
EMMA: 통합 아키텍처를 활용한 효율적인 다중모달 이해, 생성 및 편집
EditThinker: 모든 이미지 편집기에서 반복적 추론을 해제하기
TwinFlow: 자기적대적 흐름을 활용한 대규모 모델에서의 원스텝 생성 구현
CARE-PD: 파킨슨병 걸음걸이 평가를 위한 다기관 익명화 임상 데이터셋
웨넷스피치천: 방언 음성 처리를 위한 풍부한 주석을 갖춘 대규모 쓰촨어 어말집
PolypSense3D: 내시경에서 깊이 인지 기반 폴립 크기 측정을 위한 다중 소스 벤치마크 데이터셋
PhysDrive: 차량 내 운전자 모니터링을 위한 다중모달 원격 생리측정 데이터셋
인공 혼합정신: 언어 모델의 열린 경계 없는 동질성(그 이상까지)
오미니SVG: 통합적 확장 가능한 벡터 그래픽스 생성 모델
알고리즘적 사고 이론
로봇 월드 모델: 로봇 공학에서 강건한 정책 최적화를 위한 신경망 시뮬레이터
리워드 포싱: 보상 분포 매칭 디스틸레이션을 통한 효율적인 스트리밍 비디오 생성
의미론이 길을 제시한다: 비동기 잠재 확산을 통한 의미론적 및 텍스처 모델링의 조화
ARM-Thinker: 에이전트 기반 도구 사용과 시각적 추론을 통한 다중모달 생성 보상 모델 강화