HyperAI

메인 페이지

GPU

콘솔
Studio
문서
가격

Pulse

뉴스

리소스

논문
노트북
데이터 세트
위키

벤치마크

SOTA
LLM 모델
GPU 리더보드

커뮤니티

이벤트

유틸리티

정보 서비스 이용약관 개인정보 처리방침
한국어

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

최신 AI 트렌드를 파악할 수 있도록 매일 업데이트되는 최첨단 AI 연구 논문

인공지능의 미래를 구축하세요

정보

회사 소개 지원 데이터 세트 도움말

제품

뉴스 논문 노트북 데이터 세트 위키

링크

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

메인 페이지

GPU

콘솔
Studio
문서
가격

Pulse

뉴스

리소스

논문
노트북
데이터 세트
위키

벤치마크

SOTA
LLM 모델
GPU 리더보드

커뮤니티

이벤트

유틸리티

정보 서비스 이용약관 개인정보 처리방침
한국어

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

최신 AI 트렌드를 파악할 수 있도록 매일 업데이트되는 최첨단 AI 연구 논문

인공지능의 미래를 구축하세요

정보

회사 소개 지원 데이터 세트 도움말

제품

뉴스 논문 노트북 데이터 세트 위키

링크

© HyperAI

GitHub Discord X (formerly Twitter)

소프트 적응형 정책 최적화

소프트 적응형 정책 최적화

Chang Gao, Chujie Zheng, Xiong-Hui Chen, et al.

스케일링 제로샷 참조-비디오 생성

스케일링 제로샷 참조-비디오 생성

비디오 생성

텍스트에서 비디오

Zijian Zhou, Shikun Liu, Haozhe Liu, et al.

Voxify3D: 픽셀 아트가 볼륨 렌더링과 만난다

이미지 투 이미지

Yi-Chuan Huang, Jiewen Chan, Hao-Jen Chien, et al.

DoVer: LLM 다중 에이전트 시스템을 위한 개입 지향 자동 디버깅

Ming Ma, Jue Zhang, Fangkai Yang, et al.

시계적 추론기를 활용한 통합 영상 편집

비디오 생성

비디오 처리

Xiangpeng Yang, Ji Xie, Yiyuan Yang, et al.

실제를 넘어서: 장문맥 LLM을 위한 회전 위치 임베딩의 상상적 확장

Xiaoran Liu, Yuerong Song, Zhigeng Liu, et al.

내재적 병렬 추론기: 자기 휘발성 강화 학습을 통한 병렬 추론

Tong Wu, Yang Liu, Jun Bai, et al.

iSeal: 신뢰성 있는 LLM 소유권 검증을 위한 암호화된 지문 기술

Zixun Xiong, Gaoyi Wu, Qingyang Yu, et al.

DAVSP: 대규모 비전-언어 모델을 위한 깊이 있는 시각적 안전 프롬프트를 통한 안전성 정렬

감독된 미세조정

Yitong Zhang, Jia Li, Liyi Cai, et al.

월드젠: 텍스트에서 탐색 가능하고 상호작용 가능한 3D 세계로

Dilin Wang, Hyunyoung Jung, Tom Monnier, et al.

서퍼모델: 간단한 산술이 최첨단 LLM 성능을 여는 비결

Shalini Maiti, Amar Budhiraja, Bhavul Gauri, et al.

DTS: 추론 트리 스케치를 통한 대규모 추론 모델의 성능 향상

Zicheng Xu, Guanchu Wang, Yu-Neng Chuang, et al.

LLM을 활용한 베이지안 최적화를 위한 적응형 커널 설계는 케이크 조각처럼 간단하다

Richard Cornelius Suwandi, Feng Yin, Juntao Wang, et al.

DePass: 간단한 분해된 전방 전파를 통한 통합적 특성 할당

자연어 처리

Xiangyu Hong, Che Jiang, Kai Tian, et al.

COOPER: 공간 지능에서 협업적 인식과 추론을 위한 통합 모델

다중 작업 학습

Zefeng Zhang, Xiangzhao Hao, Hengzhu Tang, et al.

모방에서 구분으로: 다영역 추론 과제를 향상시키는 일반화된 커리큘럼 우위 메커니즘으로

Changpeng Yang, Jinyang Wu, Yuchen Liu, et al.

PaCo-RL: 쌍별 보상 모델링을 통한 일관성 있는 이미지 생성을 위한 강화 학습의 발전

텍스트에서 이미지 생성

Bowen Ping, Chengyou Jia, Minnan Luo, et al.

EMMA: 통합 아키텍처를 활용한 효율적인 다중모달 이해, 생성 및 편집

다중 작업 학습

Xin He, Longhui Wei, Jianbo Ouyang, et al.

EditThinker: 모든 이미지 편집기에서 반복적 추론을 해제하기

이미지 생성

Hongyu Li, Manyuan Zhang, Dian Zheng, et al.

TwinFlow: 자기적대적 흐름을 활용한 대규모 모델에서의 원스텝 생성 구현

텍스트에서 이미지 생성

Zhenglin Cheng, Peng Sun, Jianguo Li, et al.

CARE-PD: 파킨슨병 걸음걸이 평가를 위한 다기관 익명화 임상 데이터셋

비디오 이해

Vida Adeli, Ivan Klabucar, Javad Rajabi, et al.

웨넷스피치천: 방언 음성 처리를 위한 풍부한 주석을 갖춘 대규모 쓰촨어 어말집

음성 및 음성 처리

Yuhang Dai, Ziyu Zhang, Shuai Wang, et al.

PolypSense3D: 내시경에서 깊이 인지 기반 폴립 크기 측정을 위한 다중 소스 벤치마크 데이터셋

세マン틱 세그멘테이션

Ruyu Liu, Lin Wang, Zhou Mingming, et al.

PhysDrive: 차량 내 운전자 모니터링을 위한 다중모달 원격 생리측정 데이터셋

컴퓨터 비전

Jiyao Wang, Xiao Yang, Qingyong Hu, et al.

인공 혼합정신: 언어 모델의 열린 경계 없는 동질성(그 이상까지)

Liwei Jiang, Yuanjun Chai, Margaret Li, et al.

오미니SVG: 통합적 확장 가능한 벡터 그래픽스 생성 모델

이미지 생성

텍스트에서 이미지 생성

Yiying Yang, Wei Cheng, Sijin Chen, et al.

알고리즘적 사고 이론

MohammadHossein Bateni, Vincent Cohen-Addad, Yuzhou Gu, et al.

로봇 월드 모델: 로봇 공학에서 강건한 정책 최적화를 위한 신경망 시뮬레이터

Chenhao Li, Andreas Krause, Marco Hutter

리워드 포싱: 보상 분포 매칭 디스틸레이션을 통한 효율적인 스트리밍 비디오 생성

비디오 생성

Yunhong Lu, Yanhong Zeng, Haobo Li, et al.

의미론이 길을 제시한다: 비동기 잠재 확산을 통한 의미론적 및 텍스처 모델링의 조화

이미지 생성

Yueming Pan, Ruoyu Feng, Qi Dai, et al.

ARM-Thinker: 에이전트 기반 도구 사용과 시각적 추론을 통한 다중모달 생성 보상 모델 강화

Preference Modeling

Shengyuan Ding, Xinyu Fang, Ziyu Liu, et al.

Nex-N1: 대규모 환경 구축을 위한 통합 생태계를 통한 에이전트 모델 훈련

Nex-AGI Team, Yuxuan Cai, Lu Chen, et al.

소프트 적응형 정책 최적화

소프트 적응형 정책 최적화

Chang Gao, Chujie Zheng, Xiong-Hui Chen, et al.

스케일링 제로샷 참조-비디오 생성

스케일링 제로샷 참조-비디오 생성

비디오 생성

텍스트에서 비디오

Zijian Zhou, Shikun Liu, Haozhe Liu, et al.

Voxify3D: 픽셀 아트가 볼륨 렌더링과 만난다

이미지 투 이미지

Yi-Chuan Huang, Jiewen Chan, Hao-Jen Chien, et al.

DoVer: LLM 다중 에이전트 시스템을 위한 개입 지향 자동 디버깅

Ming Ma, Jue Zhang, Fangkai Yang, et al.

시계적 추론기를 활용한 통합 영상 편집

비디오 생성

비디오 처리

Xiangpeng Yang, Ji Xie, Yiyuan Yang, et al.

실제를 넘어서: 장문맥 LLM을 위한 회전 위치 임베딩의 상상적 확장

Xiaoran Liu, Yuerong Song, Zhigeng Liu, et al.

내재적 병렬 추론기: 자기 휘발성 강화 학습을 통한 병렬 추론

Tong Wu, Yang Liu, Jun Bai, et al.

iSeal: 신뢰성 있는 LLM 소유권 검증을 위한 암호화된 지문 기술

Zixun Xiong, Gaoyi Wu, Qingyang Yu, et al.

DAVSP: 대규모 비전-언어 모델을 위한 깊이 있는 시각적 안전 프롬프트를 통한 안전성 정렬

감독된 미세조정

Yitong Zhang, Jia Li, Liyi Cai, et al.

월드젠: 텍스트에서 탐색 가능하고 상호작용 가능한 3D 세계로

Dilin Wang, Hyunyoung Jung, Tom Monnier, et al.

서퍼모델: 간단한 산술이 최첨단 LLM 성능을 여는 비결

Shalini Maiti, Amar Budhiraja, Bhavul Gauri, et al.

DTS: 추론 트리 스케치를 통한 대규모 추론 모델의 성능 향상

Zicheng Xu, Guanchu Wang, Yu-Neng Chuang, et al.

LLM을 활용한 베이지안 최적화를 위한 적응형 커널 설계는 케이크 조각처럼 간단하다

Richard Cornelius Suwandi, Feng Yin, Juntao Wang, et al.

DePass: 간단한 분해된 전방 전파를 통한 통합적 특성 할당

자연어 처리

Xiangyu Hong, Che Jiang, Kai Tian, et al.

COOPER: 공간 지능에서 협업적 인식과 추론을 위한 통합 모델

다중 작업 학습

Zefeng Zhang, Xiangzhao Hao, Hengzhu Tang, et al.

모방에서 구분으로: 다영역 추론 과제를 향상시키는 일반화된 커리큘럼 우위 메커니즘으로

Changpeng Yang, Jinyang Wu, Yuchen Liu, et al.

PaCo-RL: 쌍별 보상 모델링을 통한 일관성 있는 이미지 생성을 위한 강화 학습의 발전

텍스트에서 이미지 생성

Bowen Ping, Chengyou Jia, Minnan Luo, et al.

EMMA: 통합 아키텍처를 활용한 효율적인 다중모달 이해, 생성 및 편집

다중 작업 학습

Xin He, Longhui Wei, Jianbo Ouyang, et al.

EditThinker: 모든 이미지 편집기에서 반복적 추론을 해제하기

이미지 생성

Hongyu Li, Manyuan Zhang, Dian Zheng, et al.

TwinFlow: 자기적대적 흐름을 활용한 대규모 모델에서의 원스텝 생성 구현

텍스트에서 이미지 생성

Zhenglin Cheng, Peng Sun, Jianguo Li, et al.

CARE-PD: 파킨슨병 걸음걸이 평가를 위한 다기관 익명화 임상 데이터셋

비디오 이해

Vida Adeli, Ivan Klabucar, Javad Rajabi, et al.

웨넷스피치천: 방언 음성 처리를 위한 풍부한 주석을 갖춘 대규모 쓰촨어 어말집

음성 및 음성 처리

Yuhang Dai, Ziyu Zhang, Shuai Wang, et al.

PolypSense3D: 내시경에서 깊이 인지 기반 폴립 크기 측정을 위한 다중 소스 벤치마크 데이터셋

세マン틱 세그멘테이션

Ruyu Liu, Lin Wang, Zhou Mingming, et al.

PhysDrive: 차량 내 운전자 모니터링을 위한 다중모달 원격 생리측정 데이터셋

컴퓨터 비전

Jiyao Wang, Xiao Yang, Qingyong Hu, et al.

인공 혼합정신: 언어 모델의 열린 경계 없는 동질성(그 이상까지)

Liwei Jiang, Yuanjun Chai, Margaret Li, et al.

오미니SVG: 통합적 확장 가능한 벡터 그래픽스 생성 모델

이미지 생성

텍스트에서 이미지 생성

Yiying Yang, Wei Cheng, Sijin Chen, et al.

알고리즘적 사고 이론

MohammadHossein Bateni, Vincent Cohen-Addad, Yuzhou Gu, et al.

로봇 월드 모델: 로봇 공학에서 강건한 정책 최적화를 위한 신경망 시뮬레이터

Chenhao Li, Andreas Krause, Marco Hutter

리워드 포싱: 보상 분포 매칭 디스틸레이션을 통한 효율적인 스트리밍 비디오 생성

비디오 생성

Yunhong Lu, Yanhong Zeng, Haobo Li, et al.

의미론이 길을 제시한다: 비동기 잠재 확산을 통한 의미론적 및 텍스처 모델링의 조화

이미지 생성

Yueming Pan, Ruoyu Feng, Qi Dai, et al.

ARM-Thinker: 에이전트 기반 도구 사용과 시각적 추론을 통한 다중모달 생성 보상 모델 강화

Preference Modeling

Shengyuan Ding, Xinyu Fang, Ziyu Liu, et al.

Nex-N1: 대규모 환경 구축을 위한 통합 생태계를 통한 에이전트 모델 훈련

Nex-AGI Team, Yuxuan Cai, Lu Chen, et al.

Voxify3D: 픽셀 아트가 볼륨 렌더링과 만난다

DoVer: LLM 다중 에이전트 시스템을 위한 개입 지향 자동 디버깅

시계적 추론기를 활용한 통합 영상 편집

실제를 넘어서: 장문맥 LLM을 위한 회전 위치 임베딩의 상상적 확장

내재적 병렬 추론기: 자기 휘발성 강화 학습을 통한 병렬 추론

iSeal: 신뢰성 있는 LLM 소유권 검증을 위한 암호화된 지문 기술

DAVSP: 대규모 비전-언어 모델을 위한 깊이 있는 시각적 안전 프롬프트를 통한 안전성 정렬

월드젠: 텍스트에서 탐색 가능하고 상호작용 가능한 3D 세계로

서퍼모델: 간단한 산술이 최첨단 LLM 성능을 여는 비결

DTS: 추론 트리 스케치를 통한 대규모 추론 모델의 성능 향상

LLM을 활용한 베이지안 최적화를 위한 적응형 커널 설계는 케이크 조각처럼 간단하다

DePass: 간단한 분해된 전방 전파를 통한 통합적 특성 할당

COOPER: 공간 지능에서 협업적 인식과 추론을 위한 통합 모델

모방에서 구분으로: 다영역 추론 과제를 향상시키는 일반화된 커리큘럼 우위 메커니즘으로

PaCo-RL: 쌍별 보상 모델링을 통한 일관성 있는 이미지 생성을 위한 강화 학습의 발전

EMMA: 통합 아키텍처를 활용한 효율적인 다중모달 이해, 생성 및 편집

EditThinker: 모든 이미지 편집기에서 반복적 추론을 해제하기

TwinFlow: 자기적대적 흐름을 활용한 대규모 모델에서의 원스텝 생성 구현

CARE-PD: 파킨슨병 걸음걸이 평가를 위한 다기관 익명화 임상 데이터셋

웨넷스피치천: 방언 음성 처리를 위한 풍부한 주석을 갖춘 대규모 쓰촨어 어말집

PolypSense3D: 내시경에서 깊이 인지 기반 폴립 크기 측정을 위한 다중 소스 벤치마크 데이터셋

PhysDrive: 차량 내 운전자 모니터링을 위한 다중모달 원격 생리측정 데이터셋

인공 혼합정신: 언어 모델의 열린 경계 없는 동질성(그 이상까지)

오미니SVG: 통합적 확장 가능한 벡터 그래픽스 생성 모델

알고리즘적 사고 이론

로봇 월드 모델: 로봇 공학에서 강건한 정책 최적화를 위한 신경망 시뮬레이터

리워드 포싱: 보상 분포 매칭 디스틸레이션을 통한 효율적인 스트리밍 비디오 생성

의미론이 길을 제시한다: 비동기 잠재 확산을 통한 의미론적 및 텍스처 모델링의 조화

ARM-Thinker: 에이전트 기반 도구 사용과 시각적 추론을 통한 다중모달 생성 보상 모델 강화

Nex-N1: 대규모 환경 구축을 위한 통합 생태계를 통한 에이전트 모델 훈련

Voxify3D: 픽셀 아트가 볼륨 렌더링과 만난다

DoVer: LLM 다중 에이전트 시스템을 위한 개입 지향 자동 디버깅

시계적 추론기를 활용한 통합 영상 편집

실제를 넘어서: 장문맥 LLM을 위한 회전 위치 임베딩의 상상적 확장

내재적 병렬 추론기: 자기 휘발성 강화 학습을 통한 병렬 추론

iSeal: 신뢰성 있는 LLM 소유권 검증을 위한 암호화된 지문 기술

DAVSP: 대규모 비전-언어 모델을 위한 깊이 있는 시각적 안전 프롬프트를 통한 안전성 정렬

월드젠: 텍스트에서 탐색 가능하고 상호작용 가능한 3D 세계로

서퍼모델: 간단한 산술이 최첨단 LLM 성능을 여는 비결

DTS: 추론 트리 스케치를 통한 대규모 추론 모델의 성능 향상

LLM을 활용한 베이지안 최적화를 위한 적응형 커널 설계는 케이크 조각처럼 간단하다

DePass: 간단한 분해된 전방 전파를 통한 통합적 특성 할당

COOPER: 공간 지능에서 협업적 인식과 추론을 위한 통합 모델

모방에서 구분으로: 다영역 추론 과제를 향상시키는 일반화된 커리큘럼 우위 메커니즘으로

PaCo-RL: 쌍별 보상 모델링을 통한 일관성 있는 이미지 생성을 위한 강화 학습의 발전

EMMA: 통합 아키텍처를 활용한 효율적인 다중모달 이해, 생성 및 편집

EditThinker: 모든 이미지 편집기에서 반복적 추론을 해제하기

TwinFlow: 자기적대적 흐름을 활용한 대규모 모델에서의 원스텝 생성 구현

CARE-PD: 파킨슨병 걸음걸이 평가를 위한 다기관 익명화 임상 데이터셋

웨넷스피치천: 방언 음성 처리를 위한 풍부한 주석을 갖춘 대규모 쓰촨어 어말집

PolypSense3D: 내시경에서 깊이 인지 기반 폴립 크기 측정을 위한 다중 소스 벤치마크 데이터셋

PhysDrive: 차량 내 운전자 모니터링을 위한 다중모달 원격 생리측정 데이터셋

인공 혼합정신: 언어 모델의 열린 경계 없는 동질성(그 이상까지)

오미니SVG: 통합적 확장 가능한 벡터 그래픽스 생성 모델

알고리즘적 사고 이론

로봇 월드 모델: 로봇 공학에서 강건한 정책 최적화를 위한 신경망 시뮬레이터

리워드 포싱: 보상 분포 매칭 디스틸레이션을 통한 효율적인 스트리밍 비디오 생성

의미론이 길을 제시한다: 비동기 잠재 확산을 통한 의미론적 및 텍스처 모델링의 조화

ARM-Thinker: 에이전트 기반 도구 사용과 시각적 추론을 통한 다중모달 생성 보상 모델 강화

Nex-N1: 대규모 환경 구축을 위한 통합 생태계를 통한 에이전트 모델 훈련