HyperAI

메인 페이지

GPU

콘솔
Studio
문서
가격

Pulse

뉴스

리소스

논문
노트북
데이터 세트
위키

벤치마크

SOTA
LLM 모델
GPU 리더보드

커뮤니티

이벤트

유틸리티

정보 서비스 이용약관 개인정보 처리방침
한국어

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

최신 AI 트렌드를 파악할 수 있도록 매일 업데이트되는 최첨단 AI 연구 논문

인공지능의 미래를 구축하세요

정보

회사 소개 지원 데이터 세트 도움말

제품

뉴스 논문 노트북 데이터 세트 위키

링크

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

메인 페이지

GPU

콘솔
Studio
문서
가격

Pulse

뉴스

리소스

논문
노트북
데이터 세트
위키

벤치마크

SOTA
LLM 모델
GPU 리더보드

커뮤니티

이벤트

유틸리티

정보 서비스 이용약관 개인정보 처리방침
한국어

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

최신 AI 트렌드를 파악할 수 있도록 매일 업데이트되는 최첨단 AI 연구 논문

인공지능의 미래를 구축하세요

정보

회사 소개 지원 데이터 세트 도움말

제품

뉴스 논문 노트북 데이터 세트 위키

링크

© HyperAI

GitHub Discord X (formerly Twitter)

오미니로티: 파라미터화된 로티 토큰을 통한 벡터 애니메이션 생성

오미니로티: 파라미터화된 로티 토큰을 통한 벡터 애니메이션 생성

비디오 생성

Yiying Yang, Wei Cheng, Sijin Chen, et al.

스케일에서 속도로: 이미지 편집을 위한 적응형 테스트 시점 스케일링

스케일에서 속도로: 이미지 편집을 위한 적응형 테스트 시점 스케일링

이미지 생성

이미지 투 이미지

Xiangyan Qu, Zhenlong Yuan, Jing Tang, et al.

in-context co-player inference를 통한 Multi-agent 협력

Marissa A. Weis, Maciej Wołczyk, Rajai Nasser, et al.

ACTIONENGINE: State Machine Memory를 통한 Reactive 방식에서 Programmatic GUI Agents로의 전환

Hongbin Zhong, Fazole Faisalal, Luis França, et al.

CiteAudit: 당신은 인용했지만, 읽었는가? LLM 시대의 과학적 인용문 검증을 위한 벤치마크

검색 증강 생성

Zhengqing Yuan, Kaiwen Shi, Zheyuan Zhang, et al.

모드 탐색이 빠른 긴 영상 생성을 위한 평균 탐색과 만난다

비디오 생성

Shengqu Cai, Weili Nie, Chao Liu, et al.

CUDA Agent: 고성능 CUDA 커널 생성을 위한 대규모 에이전트형 강화학습

AI 컴파일러

Weinan Dai, Hanlin Wu, Qiying Yu, et al.

번역을 통한 복원: 벤치마크 및 데이터셋의 자동 번역을 위한 효율적인 파이프라인

Hanna Yukhymenko, Anton Alexandrov, Martin Vechev

이미지 생성에서 공간적 이해 향상을 위한 보상 모델링

이미지 생성

텍스트에서 이미지 생성

Zhenyu Tang, Chaoran Feng, Yufan Deng, et al.

dLLM: 간단한 확산 언어 모델링

텍스트 생성

Zhanhui Zhou, Lingjie Chen, Hanghang Tong, et al.

실험적 메모리 증강 LLM 에이전트: 하이브리드 온폴리시 및 오프폴리시 최적화를 통한 접근

Zeyuan Liu, Jeonghye Kim, Xufang Luo, et al.

상상력은 시각적 추론에 도움이 되지만, 아직는 잠재 공간에서는 그렇지 않다

시각 질문 응답

You Li, Chi Chen, Yanghao Li, et al.

오미나지아: 네이티브 옴니모달 AI 에이전트를 향해

Xiaoxi Li, Wenxiang Jiao, Jiarui Jin, et al.

MobilityBench: 실제 이동 환경에서의 경로 계획 Agent 평가를 위한 벤치마크

지능형 질문 응답

Zhiheng Song, Jingshuai Zhang, Chuan Qin, et al.

맹점에서 성과로: 대규모 다중모달 모델을 위한 진단 기반 반복 훈련

Hongrui Jia, Chaoya Jiang, Shikun Zhang, et al.

일관성의 삼위일체: 일반 세계 모델을 정의하는 원칙

다중모달 표현

Jingxuan Wei, Siyuan Li, Yuhang Xu, et al.

GUI-Libra: 동작 인지 감독과 부분 검증 가능한 RL을 통한 네이티브 GUI 에이전트의 추론 및 행동 훈련

감독된 미세조정

Rui Yang, Qianhui Wu, Zhaoyang Wang, et al.

SkyReels-V4: 다중 모달 영상-오디오 생성, 인페인팅 및 편집 모델

텍스트에서 비디오

Guibin Chen, Dixuan Lin, Jiangping Yang, et al.

ARLArena: 안정적인 에이전트 강화 학습을 위한 통합 프레임워크

Xiaoxuan Wang, Han Zhang, Haixin Wang, et al.

DreamID-Omni: 제어 가능한 인간 중심의 오디오-비디오 생성을 위한 통합 프레임워크

Xu Guo, Fulong Ye, Qichao Sun, et al.

MolHIT: 계층적 이산 확산 모델을 통한 분자 그래프 생성의 진보

사이언스를 위한 AI

Hojung Jung, Rodrigo Hormazabal, Jaehyeong Jo, et al.

HyTRec: 긴 행동 시퀀스 추천을 위한 하이브리드 시계열 인지 어텐션 아키텍처

Preference Modeling

Lei Xin, Yuhao Zheng, Ke Cheng, et al.

DREAM: Agentic Metrics를 활용한 깊이 있는 연구 평가

Elad Ben Avraham, Changhao Li, Ron Dorfman, et al.

LongCLI-Bench: 명령줄 인터페이스에서 장기 지평(agentic) 프로그래밍을 위한 초기 벤치마크 및 연구

Yukang Feng, Jianwen Sun, Zelai Yang, et al.

PyVision-RL: 강화학습을 통한 오픈형 에이전트 비전 모델 구축

비디오 이해

Shitian Zhao, Shaoheng Lin, Ming Li, et al.

지각에서 행동으로: 시각적 추론을 위한 상호작용 기준 평가

다중모달 표현

Yuhao Wu, Maojia Song, Yihuai Lan, et al.

쿼리 중심형 및 메모리 인지형 리랭커: 긴 컨텍스트 처리를 위한 접근

검색 증강 생성

Yuqing Li, Jiangnan Li, Mo Yu, et al.

LLM 터미널 기능 확장 위한 데이터 엔지니어링

Renjie Pi, Grace Lam, Mohammad Shoeybi, et al.

DSDR: LLM 추론에서 탐색을 위한 이중 스케일 다각도 정규화

Zhongwei Wan, Yun Shen, Zhihao Dou, et al.

Mobile-O: 모바일 디바이스에서의 통합 다중모달 이해 및 생성

Abdelrahman Shaker, Ahmed Heakl, Jaseel Muhammad, et al.

TOPReward: 로보틱스를 위한 숨겨진 제로샷 보상으로서 토큰 확률

다중모달 표현

Shirui Chen, Cole Harrison, Ying-Chun Lee, et al.

ManCAR: 순차 추천을 위한 맨폴드 제약 잠재 추론 및 적응형 테스트 시 계산

Preference Modeling

다중 작업 학습

Kun Yang, Yuxuan Zhu, Yazhe Chen, et al.

오미니로티: 파라미터화된 로티 토큰을 통한 벡터 애니메이션 생성

오미니로티: 파라미터화된 로티 토큰을 통한 벡터 애니메이션 생성

비디오 생성

Yiying Yang, Wei Cheng, Sijin Chen, et al.

스케일에서 속도로: 이미지 편집을 위한 적응형 테스트 시점 스케일링

스케일에서 속도로: 이미지 편집을 위한 적응형 테스트 시점 스케일링

이미지 생성

이미지 투 이미지

Xiangyan Qu, Zhenlong Yuan, Jing Tang, et al.

in-context co-player inference를 통한 Multi-agent 협력

Marissa A. Weis, Maciej Wołczyk, Rajai Nasser, et al.

ACTIONENGINE: State Machine Memory를 통한 Reactive 방식에서 Programmatic GUI Agents로의 전환

Hongbin Zhong, Fazole Faisalal, Luis França, et al.

CiteAudit: 당신은 인용했지만, 읽었는가? LLM 시대의 과학적 인용문 검증을 위한 벤치마크

검색 증강 생성

Zhengqing Yuan, Kaiwen Shi, Zheyuan Zhang, et al.

모드 탐색이 빠른 긴 영상 생성을 위한 평균 탐색과 만난다

비디오 생성

Shengqu Cai, Weili Nie, Chao Liu, et al.

CUDA Agent: 고성능 CUDA 커널 생성을 위한 대규모 에이전트형 강화학습

AI 컴파일러

Weinan Dai, Hanlin Wu, Qiying Yu, et al.

번역을 통한 복원: 벤치마크 및 데이터셋의 자동 번역을 위한 효율적인 파이프라인

Hanna Yukhymenko, Anton Alexandrov, Martin Vechev

이미지 생성에서 공간적 이해 향상을 위한 보상 모델링

이미지 생성

텍스트에서 이미지 생성

Zhenyu Tang, Chaoran Feng, Yufan Deng, et al.

dLLM: 간단한 확산 언어 모델링

텍스트 생성

Zhanhui Zhou, Lingjie Chen, Hanghang Tong, et al.

실험적 메모리 증강 LLM 에이전트: 하이브리드 온폴리시 및 오프폴리시 최적화를 통한 접근

Zeyuan Liu, Jeonghye Kim, Xufang Luo, et al.

상상력은 시각적 추론에 도움이 되지만, 아직는 잠재 공간에서는 그렇지 않다

시각 질문 응답

You Li, Chi Chen, Yanghao Li, et al.

오미나지아: 네이티브 옴니모달 AI 에이전트를 향해

Xiaoxi Li, Wenxiang Jiao, Jiarui Jin, et al.

MobilityBench: 실제 이동 환경에서의 경로 계획 Agent 평가를 위한 벤치마크

지능형 질문 응답

Zhiheng Song, Jingshuai Zhang, Chuan Qin, et al.

맹점에서 성과로: 대규모 다중모달 모델을 위한 진단 기반 반복 훈련

Hongrui Jia, Chaoya Jiang, Shikun Zhang, et al.

일관성의 삼위일체: 일반 세계 모델을 정의하는 원칙

다중모달 표현

Jingxuan Wei, Siyuan Li, Yuhang Xu, et al.

GUI-Libra: 동작 인지 감독과 부분 검증 가능한 RL을 통한 네이티브 GUI 에이전트의 추론 및 행동 훈련

감독된 미세조정

Rui Yang, Qianhui Wu, Zhaoyang Wang, et al.

SkyReels-V4: 다중 모달 영상-오디오 생성, 인페인팅 및 편집 모델

텍스트에서 비디오

Guibin Chen, Dixuan Lin, Jiangping Yang, et al.

ARLArena: 안정적인 에이전트 강화 학습을 위한 통합 프레임워크

Xiaoxuan Wang, Han Zhang, Haixin Wang, et al.

DreamID-Omni: 제어 가능한 인간 중심의 오디오-비디오 생성을 위한 통합 프레임워크

Xu Guo, Fulong Ye, Qichao Sun, et al.

MolHIT: 계층적 이산 확산 모델을 통한 분자 그래프 생성의 진보

사이언스를 위한 AI

Hojung Jung, Rodrigo Hormazabal, Jaehyeong Jo, et al.

HyTRec: 긴 행동 시퀀스 추천을 위한 하이브리드 시계열 인지 어텐션 아키텍처

Preference Modeling

Lei Xin, Yuhao Zheng, Ke Cheng, et al.

DREAM: Agentic Metrics를 활용한 깊이 있는 연구 평가

Elad Ben Avraham, Changhao Li, Ron Dorfman, et al.

LongCLI-Bench: 명령줄 인터페이스에서 장기 지평(agentic) 프로그래밍을 위한 초기 벤치마크 및 연구

Yukang Feng, Jianwen Sun, Zelai Yang, et al.

PyVision-RL: 강화학습을 통한 오픈형 에이전트 비전 모델 구축

비디오 이해

Shitian Zhao, Shaoheng Lin, Ming Li, et al.

지각에서 행동으로: 시각적 추론을 위한 상호작용 기준 평가

다중모달 표현

Yuhao Wu, Maojia Song, Yihuai Lan, et al.

쿼리 중심형 및 메모리 인지형 리랭커: 긴 컨텍스트 처리를 위한 접근

검색 증강 생성

Yuqing Li, Jiangnan Li, Mo Yu, et al.

LLM 터미널 기능 확장 위한 데이터 엔지니어링

Renjie Pi, Grace Lam, Mohammad Shoeybi, et al.

DSDR: LLM 추론에서 탐색을 위한 이중 스케일 다각도 정규화

Zhongwei Wan, Yun Shen, Zhihao Dou, et al.

Mobile-O: 모바일 디바이스에서의 통합 다중모달 이해 및 생성

Abdelrahman Shaker, Ahmed Heakl, Jaseel Muhammad, et al.

TOPReward: 로보틱스를 위한 숨겨진 제로샷 보상으로서 토큰 확률

다중모달 표현

Shirui Chen, Cole Harrison, Ying-Chun Lee, et al.

ManCAR: 순차 추천을 위한 맨폴드 제약 잠재 추론 및 적응형 테스트 시 계산

Preference Modeling

다중 작업 학습

Kun Yang, Yuxuan Zhu, Yazhe Chen, et al.

in-context co-player inference를 통한 Multi-agent 협력

ACTIONENGINE: State Machine Memory를 통한 Reactive 방식에서 Programmatic GUI Agents로의 전환

CiteAudit: 당신은 인용했지만, 읽었는가? LLM 시대의 과학적 인용문 검증을 위한 벤치마크

모드 탐색이 빠른 긴 영상 생성을 위한 평균 탐색과 만난다

CUDA Agent: 고성능 CUDA 커널 생성을 위한 대규모 에이전트형 강화학습

번역을 통한 복원: 벤치마크 및 데이터셋의 자동 번역을 위한 효율적인 파이프라인

이미지 생성에서 공간적 이해 향상을 위한 보상 모델링

dLLM: 간단한 확산 언어 모델링

실험적 메모리 증강 LLM 에이전트: 하이브리드 온폴리시 및 오프폴리시 최적화를 통한 접근

상상력은 시각적 추론에 도움이 되지만, 아직는 잠재 공간에서는 그렇지 않다

오미나지아: 네이티브 옴니모달 AI 에이전트를 향해

MobilityBench: 실제 이동 환경에서의 경로 계획 Agent 평가를 위한 벤치마크

맹점에서 성과로: 대규모 다중모달 모델을 위한 진단 기반 반복 훈련

일관성의 삼위일체: 일반 세계 모델을 정의하는 원칙

GUI-Libra: 동작 인지 감독과 부분 검증 가능한 RL을 통한 네이티브 GUI 에이전트의 추론 및 행동 훈련

SkyReels-V4: 다중 모달 영상-오디오 생성, 인페인팅 및 편집 모델

ARLArena: 안정적인 에이전트 강화 학습을 위한 통합 프레임워크

DreamID-Omni: 제어 가능한 인간 중심의 오디오-비디오 생성을 위한 통합 프레임워크

MolHIT: 계층적 이산 확산 모델을 통한 분자 그래프 생성의 진보

HyTRec: 긴 행동 시퀀스 추천을 위한 하이브리드 시계열 인지 어텐션 아키텍처

DREAM: Agentic Metrics를 활용한 깊이 있는 연구 평가

LongCLI-Bench: 명령줄 인터페이스에서 장기 지평(agentic) 프로그래밍을 위한 초기 벤치마크 및 연구

PyVision-RL: 강화학습을 통한 오픈형 에이전트 비전 모델 구축

지각에서 행동으로: 시각적 추론을 위한 상호작용 기준 평가

쿼리 중심형 및 메모리 인지형 리랭커: 긴 컨텍스트 처리를 위한 접근

LLM 터미널 기능 확장 위한 데이터 엔지니어링

DSDR: LLM 추론에서 탐색을 위한 이중 스케일 다각도 정규화

Mobile-O: 모바일 디바이스에서의 통합 다중모달 이해 및 생성

TOPReward: 로보틱스를 위한 숨겨진 제로샷 보상으로서 토큰 확률

ManCAR: 순차 추천을 위한 맨폴드 제약 잠재 추론 및 적응형 테스트 시 계산

in-context co-player inference를 통한 Multi-agent 협력

ACTIONENGINE: State Machine Memory를 통한 Reactive 방식에서 Programmatic GUI Agents로의 전환

CiteAudit: 당신은 인용했지만, 읽었는가? LLM 시대의 과학적 인용문 검증을 위한 벤치마크

모드 탐색이 빠른 긴 영상 생성을 위한 평균 탐색과 만난다

CUDA Agent: 고성능 CUDA 커널 생성을 위한 대규모 에이전트형 강화학습

번역을 통한 복원: 벤치마크 및 데이터셋의 자동 번역을 위한 효율적인 파이프라인

이미지 생성에서 공간적 이해 향상을 위한 보상 모델링

dLLM: 간단한 확산 언어 모델링

실험적 메모리 증강 LLM 에이전트: 하이브리드 온폴리시 및 오프폴리시 최적화를 통한 접근

상상력은 시각적 추론에 도움이 되지만, 아직는 잠재 공간에서는 그렇지 않다

오미나지아: 네이티브 옴니모달 AI 에이전트를 향해

MobilityBench: 실제 이동 환경에서의 경로 계획 Agent 평가를 위한 벤치마크

맹점에서 성과로: 대규모 다중모달 모델을 위한 진단 기반 반복 훈련

일관성의 삼위일체: 일반 세계 모델을 정의하는 원칙

GUI-Libra: 동작 인지 감독과 부분 검증 가능한 RL을 통한 네이티브 GUI 에이전트의 추론 및 행동 훈련

SkyReels-V4: 다중 모달 영상-오디오 생성, 인페인팅 및 편집 모델

ARLArena: 안정적인 에이전트 강화 학습을 위한 통합 프레임워크

DreamID-Omni: 제어 가능한 인간 중심의 오디오-비디오 생성을 위한 통합 프레임워크

MolHIT: 계층적 이산 확산 모델을 통한 분자 그래프 생성의 진보

HyTRec: 긴 행동 시퀀스 추천을 위한 하이브리드 시계열 인지 어텐션 아키텍처

DREAM: Agentic Metrics를 활용한 깊이 있는 연구 평가

LongCLI-Bench: 명령줄 인터페이스에서 장기 지평(agentic) 프로그래밍을 위한 초기 벤치마크 및 연구

PyVision-RL: 강화학습을 통한 오픈형 에이전트 비전 모델 구축

지각에서 행동으로: 시각적 추론을 위한 상호작용 기준 평가

쿼리 중심형 및 메모리 인지형 리랭커: 긴 컨텍스트 처리를 위한 접근

LLM 터미널 기능 확장 위한 데이터 엔지니어링

DSDR: LLM 추론에서 탐색을 위한 이중 스케일 다각도 정규화

Mobile-O: 모바일 디바이스에서의 통합 다중모달 이해 및 생성

TOPReward: 로보틱스를 위한 숨겨진 제로샷 보상으로서 토큰 확률

ManCAR: 순차 추천을 위한 맨폴드 제약 잠재 추론 및 적응형 테스트 시 계산