Command Palette
Search for a command to run...
Papers
최신 AI 트렌드를 파악할 수 있도록 매일 업데이트되는 최첨단 AI 연구 논문

엔트로피에서 에피플렉서티(Epiplexity)로: 계산적 제약을 가진 지능을 위한 정보의 재고 (Rethinking Information for Computationally Bounded Intelligence)

Tri-Modal Masked Diffusion Models의 Design Space































엔트로피에서 에피플렉서티(Epiplexity)로: 계산적 제약을 가진 지능을 위한 정보의 재고 (Rethinking Information for Computationally Bounded Intelligence)

Tri-Modal Masked Diffusion Models의 Design Space






























CHIMERA: 일반화 가능한 LLM 추론을 위한 컴팩트한 합성 데이터
RubricBench: 모델 생성 루브릭과 인간 기준의 일치
MMR-Life: 다중 모달 다중 이미지 추론을 위한 실제 장면의 조각 맞추기
OpenAutoNLU: NLU를 위한 오픈소스 AutoML 라이브러리
오미니로티: 파라미터화된 로티 토큰을 통한 벡터 애니메이션 생성
스케일에서 속도로: 이미지 편집을 위한 적응형 테스트 시점 스케일링
in-context co-player inference를 통한 Multi-agent 협력
ACTIONENGINE: State Machine Memory를 통한 Reactive 방식에서 Programmatic GUI Agents로의 전환
CiteAudit: 당신은 인용했지만, 읽었는가? LLM 시대의 과학적 인용문 검증을 위한 벤치마크
모드 탐색이 빠른 긴 영상 생성을 위한 평균 탐색과 만난다
CUDA Agent: 고성능 CUDA 커널 생성을 위한 대규모 에이전트형 강화학습
번역을 통한 복원: 벤치마크 및 데이터셋의 자동 번역을 위한 효율적인 파이프라인
이미지 생성에서 공간적 이해 향상을 위한 보상 모델링
dLLM: 간단한 확산 언어 모델링
실험적 메모리 증강 LLM 에이전트: 하이브리드 온폴리시 및 오프폴리시 최적화를 통한 접근
상상력은 시각적 추론에 도움이 되지만, 아직는 잠재 공간에서는 그렇지 않다
오미나지아: 네이티브 옴니모달 AI 에이전트를 향해
MobilityBench: 실제 이동 환경에서의 경로 계획 Agent 평가를 위한 벤치마크
맹점에서 성과로: 대규모 다중모달 모델을 위한 진단 기반 반복 훈련
일관성의 삼위일체: 일반 세계 모델을 정의하는 원칙
GUI-Libra: 동작 인지 감독과 부분 검증 가능한 RL을 통한 네이티브 GUI 에이전트의 추론 및 행동 훈련
SkyReels-V4: 다중 모달 영상-오디오 생성, 인페인팅 및 편집 모델
ARLArena: 안정적인 에이전트 강화 학습을 위한 통합 프레임워크
DreamID-Omni: 제어 가능한 인간 중심의 오디오-비디오 생성을 위한 통합 프레임워크
MolHIT: 계층적 이산 확산 모델을 통한 분자 그래프 생성의 진보
HyTRec: 긴 행동 시퀀스 추천을 위한 하이브리드 시계열 인지 어텐션 아키텍처
DREAM: Agentic Metrics를 활용한 깊이 있는 연구 평가
LongCLI-Bench: 명령줄 인터페이스에서 장기 지평(agentic) 프로그래밍을 위한 초기 벤치마크 및 연구
PyVision-RL: 강화학습을 통한 오픈형 에이전트 비전 모델 구축
지각에서 행동으로: 시각적 추론을 위한 상호작용 기준 평가
CHIMERA: 일반화 가능한 LLM 추론을 위한 컴팩트한 합성 데이터
RubricBench: 모델 생성 루브릭과 인간 기준의 일치
MMR-Life: 다중 모달 다중 이미지 추론을 위한 실제 장면의 조각 맞추기
OpenAutoNLU: NLU를 위한 오픈소스 AutoML 라이브러리
오미니로티: 파라미터화된 로티 토큰을 통한 벡터 애니메이션 생성
스케일에서 속도로: 이미지 편집을 위한 적응형 테스트 시점 스케일링
in-context co-player inference를 통한 Multi-agent 협력
ACTIONENGINE: State Machine Memory를 통한 Reactive 방식에서 Programmatic GUI Agents로의 전환
CiteAudit: 당신은 인용했지만, 읽었는가? LLM 시대의 과학적 인용문 검증을 위한 벤치마크
모드 탐색이 빠른 긴 영상 생성을 위한 평균 탐색과 만난다
CUDA Agent: 고성능 CUDA 커널 생성을 위한 대규모 에이전트형 강화학습
번역을 통한 복원: 벤치마크 및 데이터셋의 자동 번역을 위한 효율적인 파이프라인
이미지 생성에서 공간적 이해 향상을 위한 보상 모델링
dLLM: 간단한 확산 언어 모델링
실험적 메모리 증강 LLM 에이전트: 하이브리드 온폴리시 및 오프폴리시 최적화를 통한 접근
상상력은 시각적 추론에 도움이 되지만, 아직는 잠재 공간에서는 그렇지 않다
오미나지아: 네이티브 옴니모달 AI 에이전트를 향해
MobilityBench: 실제 이동 환경에서의 경로 계획 Agent 평가를 위한 벤치마크
맹점에서 성과로: 대규모 다중모달 모델을 위한 진단 기반 반복 훈련
일관성의 삼위일체: 일반 세계 모델을 정의하는 원칙
GUI-Libra: 동작 인지 감독과 부분 검증 가능한 RL을 통한 네이티브 GUI 에이전트의 추론 및 행동 훈련
SkyReels-V4: 다중 모달 영상-오디오 생성, 인페인팅 및 편집 모델
ARLArena: 안정적인 에이전트 강화 학습을 위한 통합 프레임워크
DreamID-Omni: 제어 가능한 인간 중심의 오디오-비디오 생성을 위한 통합 프레임워크
MolHIT: 계층적 이산 확산 모델을 통한 분자 그래프 생성의 진보
HyTRec: 긴 행동 시퀀스 추천을 위한 하이브리드 시계열 인지 어텐션 아키텍처
DREAM: Agentic Metrics를 활용한 깊이 있는 연구 평가
LongCLI-Bench: 명령줄 인터페이스에서 장기 지평(agentic) 프로그래밍을 위한 초기 벤치마크 및 연구
PyVision-RL: 강화학습을 통한 오픈형 에이전트 비전 모델 구축
지각에서 행동으로: 시각적 추론을 위한 상호작용 기준 평가