Command Palette
Search for a command to run...
Papers
최신 AI 트렌드를 파악할 수 있도록 매일 업데이트되는 최첨단 AI 연구 논문

정방향 단일 출발지 최단 경로 문제의 정렬 장벽 극복

GR-Dexter 기술 보고서































정방향 단일 출발지 최단 경로 문제의 정렬 장벽 극복

GR-Dexter 기술 보고서






























VideoAuto-R1: 한 번 생각하고 두 번 답변하는 영상 자동 추론
RelayLLM: 협업 디코딩을 통한 효율적인 추론
토큰 단위 LLM 협업을 위한 FusionRoute
RL-AWB: 저조도 야간 장면에서의 자동 화이트 밸런스 보정을 위한 딥 강화 학습
학습 가능한 스�caler: 언어 모델 행렬 계층의 스케일을 해방시키기
GDPO: 다중 보상 강화학습 최적화를 위한 그룹 보상 분리 정규화 정책 최적화
MemRL: 에피소드 메모리 위에서 런타임 강화 학습을 통한 자가진화 에이전트
실패에서 숙련으로: 도구 사용 에이전트를 위한 어려운 샘플 생성
다이나믹한 객체의 세계를 조율하다
Klear: 통합 다중 작업 음성-영상 공동 생성
Atlas: 다중 도메인 복잡한 추론을 위한 이질적 모델 및 도구의 조율
Benchmark^2: LLM 벤치마크의 체계적 평가
MindWatcher: 더 스마트한 다중모달 도구 통합 추론을 향해
엔트로피 적응형 피인식 학습: 확신된 모순을 해결하여 망각을 완화하기 위해
다양성과 정밀도 중 무엇을 선택할 것인가? 다음 토큰 예측에 대한 심층 분석
공자 코드 에이전트: 실세계 코드베이스를 위한 확장 가능한 에이전트 스케일링
드림스타일: 비디오 스타일라이제이션을 위한 통합 프레임워크
유니코른: 자가 생성된 감독을 통한 자기 개선형 통합 다중모달 모델 지향
LTX-2: 효율적인 공동 오디오-비전 기반 모델
SciEvalKit: 과학적 일반지능을 위한 오픈소스 평가 키트
MOSS Transcribe Diarize: 화자 디아라이제이션을 통한 정확한 음성 인식
InfiniDepth: 신경 은닉 필드를 활용한 임의 해상도 및 세밀한 깊이 추정
에이전트형 AI의 적응
대규모 비디오 플래너를 통한 일반화 가능한 로봇 제어
무한VGGT: 끝없는 스트림을 위한 시각 기하 기반 트랜스포머
GARDO: 보상 해킹 없이 확산 모델 강화하기
VAR RL 올바르게 하기: 시각적 자동회귀 생성에서 비동기 정책 갈등 해결
DreamID-V: Diffusion Transformer를 통한 고해상도 얼굴 교체를 위한 이미지-비디오 갭 해소
NextFlow: 통합 순차 모델링이 다중모달 이해 및 생성을 활성화한다
K-EXAONE 기술 보고서
VideoAuto-R1: 한 번 생각하고 두 번 답변하는 영상 자동 추론
RelayLLM: 협업 디코딩을 통한 효율적인 추론
토큰 단위 LLM 협업을 위한 FusionRoute
RL-AWB: 저조도 야간 장면에서의 자동 화이트 밸런스 보정을 위한 딥 강화 학습
학습 가능한 스�caler: 언어 모델 행렬 계층의 스케일을 해방시키기
GDPO: 다중 보상 강화학습 최적화를 위한 그룹 보상 분리 정규화 정책 최적화
MemRL: 에피소드 메모리 위에서 런타임 강화 학습을 통한 자가진화 에이전트
실패에서 숙련으로: 도구 사용 에이전트를 위한 어려운 샘플 생성
다이나믹한 객체의 세계를 조율하다
Klear: 통합 다중 작업 음성-영상 공동 생성
Atlas: 다중 도메인 복잡한 추론을 위한 이질적 모델 및 도구의 조율
Benchmark^2: LLM 벤치마크의 체계적 평가
MindWatcher: 더 스마트한 다중모달 도구 통합 추론을 향해
엔트로피 적응형 피인식 학습: 확신된 모순을 해결하여 망각을 완화하기 위해
다양성과 정밀도 중 무엇을 선택할 것인가? 다음 토큰 예측에 대한 심층 분석
공자 코드 에이전트: 실세계 코드베이스를 위한 확장 가능한 에이전트 스케일링
드림스타일: 비디오 스타일라이제이션을 위한 통합 프레임워크
유니코른: 자가 생성된 감독을 통한 자기 개선형 통합 다중모달 모델 지향
LTX-2: 효율적인 공동 오디오-비전 기반 모델
SciEvalKit: 과학적 일반지능을 위한 오픈소스 평가 키트
MOSS Transcribe Diarize: 화자 디아라이제이션을 통한 정확한 음성 인식
InfiniDepth: 신경 은닉 필드를 활용한 임의 해상도 및 세밀한 깊이 추정
에이전트형 AI의 적응
대규모 비디오 플래너를 통한 일반화 가능한 로봇 제어
무한VGGT: 끝없는 스트림을 위한 시각 기하 기반 트랜스포머
GARDO: 보상 해킹 없이 확산 모델 강화하기
VAR RL 올바르게 하기: 시각적 자동회귀 생성에서 비동기 정책 갈등 해결
DreamID-V: Diffusion Transformer를 통한 고해상도 얼굴 교체를 위한 이미지-비디오 갭 해소
NextFlow: 통합 순차 모델링이 다중모달 이해 및 생성을 활성화한다
K-EXAONE 기술 보고서