Command Palette
Search for a command to run...
Papers
최신 AI 트렌드를 파악할 수 있도록 매일 업데이트되는 최첨단 AI 연구 논문

RAGEN-2: Agentic RL에서의 Reasoning Collapse

Vanast: 합성된 Triplet Supervision을 통한 인체 이미지 Animation 기반의 Virtual Try-On































RAGEN-2: Agentic RL에서의 Reasoning Collapse

Vanast: 합성된 Triplet Supervision을 통한 인체 이미지 Animation 기반의 Virtual Try-On






























ThinkTwice: 추론 및 Self-Refinement를 위한 Large Language Models의 공동 최적화
ACES: 누가 테스트를 테스트하는가? 코드 Generation을 위한 Leave-One-Out AUC Consistency
Agent Trajectories로부터 Retrieval하는 법 배우기
Claw-Eval: 자율형 Agent의 신뢰할 수 있는 Evaluation을 향하여
Video-MME-v2: 포괄적인 Video Understanding을 위한 Benchmark의 다음 단계로의 도약
GrandCode: Agentic Reinforcement Learning을 통해 Competitive Programming에서 Grandmaster 레벨 달성하기
LIBERO-Para: VLA 모델의 Paraphrase Robustness 진단을 위한 Benchmark 및 Metrics
TriAttention: 삼각함수 기반 KV Compression을 통한 효율적인 Long Reasoning
MinerU2.5-Pro: 대규모 데이터 중심 Document Parsing의 한계를 돌파하다
Adam's Law: Large Language Models에서의 텍스트 빈도 법칙 (Textual Frequency Law)
OpenWorldLib: 고급 World Models를 위한 통합 Codebase 및 Definition
WAXAL: 대규모 다국어 아프리카 언어 음성 말뭉치
DRACO: 심층 연구의 정확성, 완전성 및 객관성을 위한 교차 도메인 벤치마크
HuatuoGPT-o1: LLMs를 활용한 의료 복잡 추론을 위한 연구
AgentSocialBench: 인간 중심의 Agentic Social Networks 에서 프라이버시 위험 평가
InCoder-32B-Thinking: 사고를 위한 산업용 코드 월드 모델
Agentic-MME: Agentic Capability 가 실제로 멀티모달 지능에 무엇을 가져오는가?
Token Warping 이 MLLMs 로 하여금 근접한 관점에서 관찰하도록 돕습니다
Self-Distilled RLVR
스트리밍 비디오 이해를 위한 간단한 베이스라인
CORAL: 오픈 엔디드 디스커버리를 위한 자율적 멀티 에이전트 진화를 향해
Steerable Visual Representations
SKILL0: 컨텍스트 내 에이전트 강화 학습을 통한 스킬 내재화
Generative World Renderer
잠재 공간: 기초, 진화, 메커니즘, 능력 및 전망
DataFlex: 대규모 언어 모델의 데이터 중심 동적 훈련을 위한 통합 프레임워크
QuitoBench: 고품질 오픈 시계열 예측 벤치마크
Vision2Web: 에이전트 검증을 통한 시각적 웹 개발을 위한 계층적 벤치마크
ViGoR-Bench: 시각 생성 모델이 제로샷 시각 추론기에 얼마나 가까운가?
MiroEval: 프로세스 및 산출물에 대한 멀티모달 딥 리서치 에이전트 벤치마킹
ThinkTwice: 추론 및 Self-Refinement를 위한 Large Language Models의 공동 최적화
ACES: 누가 테스트를 테스트하는가? 코드 Generation을 위한 Leave-One-Out AUC Consistency
Agent Trajectories로부터 Retrieval하는 법 배우기
Claw-Eval: 자율형 Agent의 신뢰할 수 있는 Evaluation을 향하여
Video-MME-v2: 포괄적인 Video Understanding을 위한 Benchmark의 다음 단계로의 도약
GrandCode: Agentic Reinforcement Learning을 통해 Competitive Programming에서 Grandmaster 레벨 달성하기
LIBERO-Para: VLA 모델의 Paraphrase Robustness 진단을 위한 Benchmark 및 Metrics
TriAttention: 삼각함수 기반 KV Compression을 통한 효율적인 Long Reasoning
MinerU2.5-Pro: 대규모 데이터 중심 Document Parsing의 한계를 돌파하다
Adam's Law: Large Language Models에서의 텍스트 빈도 법칙 (Textual Frequency Law)
OpenWorldLib: 고급 World Models를 위한 통합 Codebase 및 Definition
WAXAL: 대규모 다국어 아프리카 언어 음성 말뭉치
DRACO: 심층 연구의 정확성, 완전성 및 객관성을 위한 교차 도메인 벤치마크
HuatuoGPT-o1: LLMs를 활용한 의료 복잡 추론을 위한 연구
AgentSocialBench: 인간 중심의 Agentic Social Networks 에서 프라이버시 위험 평가
InCoder-32B-Thinking: 사고를 위한 산업용 코드 월드 모델
Agentic-MME: Agentic Capability 가 실제로 멀티모달 지능에 무엇을 가져오는가?
Token Warping 이 MLLMs 로 하여금 근접한 관점에서 관찰하도록 돕습니다
Self-Distilled RLVR
스트리밍 비디오 이해를 위한 간단한 베이스라인
CORAL: 오픈 엔디드 디스커버리를 위한 자율적 멀티 에이전트 진화를 향해
Steerable Visual Representations
SKILL0: 컨텍스트 내 에이전트 강화 학습을 통한 스킬 내재화
Generative World Renderer
잠재 공간: 기초, 진화, 메커니즘, 능력 및 전망
DataFlex: 대규모 언어 모델의 데이터 중심 동적 훈련을 위한 통합 프레임워크
QuitoBench: 고품질 오픈 시계열 예측 벤치마크
Vision2Web: 에이전트 검증을 통한 시각적 웹 개발을 위한 계층적 벤치마크
ViGoR-Bench: 시각 생성 모델이 제로샷 시각 추론기에 얼마나 가까운가?
MiroEval: 프로세스 및 산출물에 대한 멀티모달 딥 리서치 에이전트 벤치마킹