HyperAI

메인 페이지

GPU

콘솔
Studio
문서
가격

Pulse

뉴스

리소스

논문
노트북
데이터 세트
위키

벤치마크

SOTA
LLM 모델
GPU 리더보드

커뮤니티

이벤트

유틸리티

정보 서비스 이용약관 개인정보 처리방침
한국어

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

최신 AI 트렌드를 파악할 수 있도록 매일 업데이트되는 최첨단 AI 연구 논문

인공지능의 미래를 구축하세요

정보

회사 소개 지원 데이터 세트 도움말

제품

뉴스 논문 노트북 데이터 세트 위키

링크

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

메인 페이지

GPU

콘솔
Studio
문서
가격

Pulse

뉴스

리소스

논문
노트북
데이터 세트
위키

벤치마크

SOTA
LLM 모델
GPU 리더보드

커뮤니티

이벤트

유틸리티

정보 서비스 이용약관 개인정보 처리방침
한국어

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

최신 AI 트렌드를 파악할 수 있도록 매일 업데이트되는 최첨단 AI 연구 논문

인공지능의 미래를 구축하세요

정보

회사 소개 지원 데이터 세트 도움말

제품

뉴스 논문 노트북 데이터 세트 위키

링크

© HyperAI

GitHub Discord X (formerly Twitter)

OpenThoughts-Agent: 에이전트 모델을 위한 데이터 레시피

OpenThoughts-Agent: 에이전트 모델을 위한 데이터 레시피

Negin Raoof, Richard Zhuang, Marianna Nezhurina, et al.

LingxiDiagBench: 중국 정신과 상담 및 진단에서 LLMs를 벤치마킹하기 위한 Multi-Agent 프레임워크

LingxiDiagBench: 중국 정신과 상담 및 진단에서 LLMs를 벤치마킹하기 위한 Multi-Agent 프레임워크

Shihao Xu, Tiancheng Zhou, Jiatong Ma, et al.

AOHP: 개인화된, 효율적이며 안전한 상호작용을 위한 오픈소스 OS 수준 Agent 하니스

Shanhui Zhao, Jiacheng Liu, Guohong Liu, et al.

MemGUI-Agent: 선제적 컨텍스트 관리를 갖춘 엔드투엔드 장기 모바일 GUI Agent

Guangyi Liu, Gao Wu, Congxiao Liu, et al.

MobileForge: 계층적 피드백 유도 정책 최적화를 통한 모바일 GUI Agents를 위한 주석 없는 적응

Guangyi Liu, Pengxiang Zhao, Gao Wu, et al.

NatureBench: 코딩 Agents가 Nature 계열 논문의 발표된 SOTA와 맞먹을 수 있는가?

사이언스를 위한 AI

Yuru Wang, Lejun Cheng, Yuxin Zuo, et al.

Qwen-AgentWorld: 범용 agents를 위한 언어 세계 모델

Yuxin Zuo, Zikai Xiao, Li Sheng, et al.

보편적 음성 향상(Rethinking Training Targets, Architectures and Data Quality for Universal Speech Enhancement)

음성 및 음성 처리

Szu-Wei Fu, Rong Chao, Xuesong Yang, et al.

학습된 밀도 제어를 갖춘 생성형 3D 가우시안

Runjie Yan, Yan-Pei Cao, Peng Wang, et al.

TADA: 텍스트-음향 이중 정렬을 통한 음성 모델링을 위한 생성적 프레임워크

Trung Dang, Sharath Rao, Ananya Gupta, et al.

고립된 단어 그 이상의 세계: 손글씨 텍스트라인 생성을 위한 Diffusion Brush

이미지 생성

Gang Dai, Yifan Zhang, Yutao Qin, et al.

gsplat: 가우시안 스플래팅을 위한 오픈소스 라이브러리

Vickie Ye, Ruilong Li, Justin Kerr, et al.

OmniVideo-100K: 구조화된 스크립트와 증거 체인을 통한 오디오-비주얼 추론을 위한 데이터셋

비디오 이해

시각 질문 응답

Xinyue Cai, Chaoyou Fu, Yi-Fan Zhang, et al.

OPEN-SWE-TRACES: 소프트웨어 엔지니어링 에이전트를 위한 이중 모드 다국어 지식 증류의 고도화

텍스트 생성

Wasi Uddin Ahmad, Nikolai Ludwig, Somshubra Majumdar, et al.

언어 모델 추론에서 리셋이 포함된 크레딧 할당

Ankur Samanta, Akshayaa Magesh, Ayush Jain, et al.

무제한 OCR 작업 가능: 원샷 장기 파싱의 시대 환영

Baoding Zhou, Jingyun Wang, Xiaolin Wei, et al.

PlanBench-XL: 대규모 도구 생태계에서 LLM 도구 사용 Agents의 장기 계획 평가

Jiayu Liu, Qihan Lin, Cheng Qian, et al.

OpenRath: Agent 시스템을 위한 세션 중심의 런타임 상태

Fukang Wen, Zhijie Wang, Ruilin Xu

EvoEmbedding: 긴 컨텍스트 검색 및 Agentic 메모리를 위한 진화 가능한 표현

검색 증강 생성

Chang Nie, Chaoyou Fu, Junlan Feng, et al.

자신의 실수로부터 배우기: 자기 증류를 위한 학습 가능한 미세 반성 궤적 구성하기

Zhilin Huang, Hang Gao, Ziqiang Dong, et al.

세계 행동 모델: 조사

비디오 생성

Qiuhong Shen, Shihua Zhang, Yue Liao, et al.

KaLM-Reranker-V1: 압축 문서 재순위 매기기를 위한 빠르지만 후기 상호작용이 아닌

Xinping Zhao, Jiaxin Xu, Ziqi Dai, et al.

LLM FP4 사전학습에서 수축 편향 재고찰: 기하학적 기원, 체계적 영향, 및 UFP4 레시피

Qian Zhao, Kunlong Chen, Changxin Tian, et al.

HydraHead: 헤드 수준의 기능적 이질성에서 전문화된 어텐션 혼합으로

Zhentao Tan, Wei Chen, Jingyi Shen, et al.

3DCodeBench: 코드를 통한 Agentic Procedural 3D 모델링 벤치마킹

Yipeng Gao, Lei Shu, Genzhi Ye, et al.

RadImageNet-VQA: 방사학 시각 질문 답변을 위한 대규모 CT 및 MRI 데이터셋

시각 질문 응답

Leo Butsanets, Charles Corbiere, Julien Khlaut, et al.

SWE-Gym을 활용한 소프트웨어 엔지니어링 에이전트 및 검증자의 훈련

감독된 미세조정

Jiayi Pan, Xingyao Wang, Graham Neubig, et al.

MAKIEVAL: LLMs에 대한 문화적 인식 평가를 위한 다국어 자동 WiKIdata 기반 프레임워크

텍스트 생성

Raoyuan Zhao, Beiduo Chen, Barbara Plank, et al.

GeneralVLA-2: 로봇 계획을 위한 기하학적 인식 재구성 및 통제된 메모리

3D 머신 비전

검색 증강 생성

Haoyu Wang, Guoqing Ma, Zeyu Zhang, et al.

다중 턴 성찰적 마스킹이 마스크 디퓨전 모델에서 추론을 이끌어낸다

텍스트 생성

Yanming Zhang, Yihan Bian, Jingyuan Qi, et al.

BrainG3N: 제어 가능한 3D 뇌 MRI 생성을 위한 이중 목적 토크나이저

Max Van Puyvelde, Ibrahim Gulluk, Wim Van Criekinge, et al.

GateMem: 다중 원리자 공유 메모리 Agents에서의 메모리 거버넌스 벤치마킹

Zhe Ren, Yibo Yang, Yimeng Chen, et al.

OpenThoughts-Agent: 에이전트 모델을 위한 데이터 레시피

OpenThoughts-Agent: 에이전트 모델을 위한 데이터 레시피

Negin Raoof, Richard Zhuang, Marianna Nezhurina, et al.

LingxiDiagBench: 중국 정신과 상담 및 진단에서 LLMs를 벤치마킹하기 위한 Multi-Agent 프레임워크

LingxiDiagBench: 중국 정신과 상담 및 진단에서 LLMs를 벤치마킹하기 위한 Multi-Agent 프레임워크

Shihao Xu, Tiancheng Zhou, Jiatong Ma, et al.

AOHP: 개인화된, 효율적이며 안전한 상호작용을 위한 오픈소스 OS 수준 Agent 하니스

Shanhui Zhao, Jiacheng Liu, Guohong Liu, et al.

MemGUI-Agent: 선제적 컨텍스트 관리를 갖춘 엔드투엔드 장기 모바일 GUI Agent

Guangyi Liu, Gao Wu, Congxiao Liu, et al.

MobileForge: 계층적 피드백 유도 정책 최적화를 통한 모바일 GUI Agents를 위한 주석 없는 적응

Guangyi Liu, Pengxiang Zhao, Gao Wu, et al.

NatureBench: 코딩 Agents가 Nature 계열 논문의 발표된 SOTA와 맞먹을 수 있는가?

사이언스를 위한 AI

Yuru Wang, Lejun Cheng, Yuxin Zuo, et al.

Qwen-AgentWorld: 범용 agents를 위한 언어 세계 모델

Yuxin Zuo, Zikai Xiao, Li Sheng, et al.

보편적 음성 향상(Rethinking Training Targets, Architectures and Data Quality for Universal Speech Enhancement)

음성 및 음성 처리

Szu-Wei Fu, Rong Chao, Xuesong Yang, et al.

학습된 밀도 제어를 갖춘 생성형 3D 가우시안

Runjie Yan, Yan-Pei Cao, Peng Wang, et al.

TADA: 텍스트-음향 이중 정렬을 통한 음성 모델링을 위한 생성적 프레임워크

Trung Dang, Sharath Rao, Ananya Gupta, et al.

고립된 단어 그 이상의 세계: 손글씨 텍스트라인 생성을 위한 Diffusion Brush

이미지 생성

Gang Dai, Yifan Zhang, Yutao Qin, et al.

gsplat: 가우시안 스플래팅을 위한 오픈소스 라이브러리

Vickie Ye, Ruilong Li, Justin Kerr, et al.

OmniVideo-100K: 구조화된 스크립트와 증거 체인을 통한 오디오-비주얼 추론을 위한 데이터셋

비디오 이해

시각 질문 응답

Xinyue Cai, Chaoyou Fu, Yi-Fan Zhang, et al.

OPEN-SWE-TRACES: 소프트웨어 엔지니어링 에이전트를 위한 이중 모드 다국어 지식 증류의 고도화

텍스트 생성

Wasi Uddin Ahmad, Nikolai Ludwig, Somshubra Majumdar, et al.

언어 모델 추론에서 리셋이 포함된 크레딧 할당

Ankur Samanta, Akshayaa Magesh, Ayush Jain, et al.

무제한 OCR 작업 가능: 원샷 장기 파싱의 시대 환영

Baoding Zhou, Jingyun Wang, Xiaolin Wei, et al.

PlanBench-XL: 대규모 도구 생태계에서 LLM 도구 사용 Agents의 장기 계획 평가

Jiayu Liu, Qihan Lin, Cheng Qian, et al.

OpenRath: Agent 시스템을 위한 세션 중심의 런타임 상태

Fukang Wen, Zhijie Wang, Ruilin Xu

EvoEmbedding: 긴 컨텍스트 검색 및 Agentic 메모리를 위한 진화 가능한 표현

검색 증강 생성

Chang Nie, Chaoyou Fu, Junlan Feng, et al.

자신의 실수로부터 배우기: 자기 증류를 위한 학습 가능한 미세 반성 궤적 구성하기

Zhilin Huang, Hang Gao, Ziqiang Dong, et al.

세계 행동 모델: 조사

비디오 생성

Qiuhong Shen, Shihua Zhang, Yue Liao, et al.

KaLM-Reranker-V1: 압축 문서 재순위 매기기를 위한 빠르지만 후기 상호작용이 아닌

Xinping Zhao, Jiaxin Xu, Ziqi Dai, et al.

LLM FP4 사전학습에서 수축 편향 재고찰: 기하학적 기원, 체계적 영향, 및 UFP4 레시피

Qian Zhao, Kunlong Chen, Changxin Tian, et al.

HydraHead: 헤드 수준의 기능적 이질성에서 전문화된 어텐션 혼합으로

Zhentao Tan, Wei Chen, Jingyi Shen, et al.

3DCodeBench: 코드를 통한 Agentic Procedural 3D 모델링 벤치마킹

Yipeng Gao, Lei Shu, Genzhi Ye, et al.

RadImageNet-VQA: 방사학 시각 질문 답변을 위한 대규모 CT 및 MRI 데이터셋

시각 질문 응답

Leo Butsanets, Charles Corbiere, Julien Khlaut, et al.

SWE-Gym을 활용한 소프트웨어 엔지니어링 에이전트 및 검증자의 훈련

감독된 미세조정

Jiayi Pan, Xingyao Wang, Graham Neubig, et al.

MAKIEVAL: LLMs에 대한 문화적 인식 평가를 위한 다국어 자동 WiKIdata 기반 프레임워크

텍스트 생성

Raoyuan Zhao, Beiduo Chen, Barbara Plank, et al.

GeneralVLA-2: 로봇 계획을 위한 기하학적 인식 재구성 및 통제된 메모리

3D 머신 비전

검색 증강 생성

Haoyu Wang, Guoqing Ma, Zeyu Zhang, et al.

다중 턴 성찰적 마스킹이 마스크 디퓨전 모델에서 추론을 이끌어낸다

텍스트 생성

Yanming Zhang, Yihan Bian, Jingyuan Qi, et al.

BrainG3N: 제어 가능한 3D 뇌 MRI 생성을 위한 이중 목적 토크나이저

Max Van Puyvelde, Ibrahim Gulluk, Wim Van Criekinge, et al.

GateMem: 다중 원리자 공유 메모리 Agents에서의 메모리 거버넌스 벤치마킹

Zhe Ren, Yibo Yang, Yimeng Chen, et al.

AOHP: 개인화된, 효율적이며 안전한 상호작용을 위한 오픈소스 OS 수준 Agent 하니스

MemGUI-Agent: 선제적 컨텍스트 관리를 갖춘 엔드투엔드 장기 모바일 GUI Agent

MobileForge: 계층적 피드백 유도 정책 최적화를 통한 모바일 GUI Agents를 위한 주석 없는 적응

NatureBench: 코딩 Agents가 Nature 계열 논문의 발표된 SOTA와 맞먹을 수 있는가?

Qwen-AgentWorld: 범용 agents를 위한 언어 세계 모델

보편적 음성 향상(Rethinking Training Targets, Architectures and Data Quality for Universal Speech Enhancement)

학습된 밀도 제어를 갖춘 생성형 3D 가우시안

TADA: 텍스트-음향 이중 정렬을 통한 음성 모델링을 위한 생성적 프레임워크

고립된 단어 그 이상의 세계: 손글씨 텍스트라인 생성을 위한 Diffusion Brush

gsplat: 가우시안 스플래팅을 위한 오픈소스 라이브러리

OmniVideo-100K: 구조화된 스크립트와 증거 체인을 통한 오디오-비주얼 추론을 위한 데이터셋

OPEN-SWE-TRACES: 소프트웨어 엔지니어링 에이전트를 위한 이중 모드 다국어 지식 증류의 고도화

언어 모델 추론에서 리셋이 포함된 크레딧 할당

무제한 OCR 작업 가능: 원샷 장기 파싱의 시대 환영

PlanBench-XL: 대규모 도구 생태계에서 LLM 도구 사용 Agents의 장기 계획 평가

OpenRath: Agent 시스템을 위한 세션 중심의 런타임 상태

EvoEmbedding: 긴 컨텍스트 검색 및 Agentic 메모리를 위한 진화 가능한 표현

자신의 실수로부터 배우기: 자기 증류를 위한 학습 가능한 미세 반성 궤적 구성하기

세계 행동 모델: 조사

KaLM-Reranker-V1: 압축 문서 재순위 매기기를 위한 빠르지만 후기 상호작용이 아닌

LLM FP4 사전학습에서 수축 편향 재고찰: 기하학적 기원, 체계적 영향, 및 UFP4 레시피

HydraHead: 헤드 수준의 기능적 이질성에서 전문화된 어텐션 혼합으로

3DCodeBench: 코드를 통한 Agentic Procedural 3D 모델링 벤치마킹

RadImageNet-VQA: 방사학 시각 질문 답변을 위한 대규모 CT 및 MRI 데이터셋

SWE-Gym을 활용한 소프트웨어 엔지니어링 에이전트 및 검증자의 훈련

MAKIEVAL: LLMs에 대한 문화적 인식 평가를 위한 다국어 자동 WiKIdata 기반 프레임워크

GeneralVLA-2: 로봇 계획을 위한 기하학적 인식 재구성 및 통제된 메모리

다중 턴 성찰적 마스킹이 마스크 디퓨전 모델에서 추론을 이끌어낸다

BrainG3N: 제어 가능한 3D 뇌 MRI 생성을 위한 이중 목적 토크나이저

GateMem: 다중 원리자 공유 메모리 Agents에서의 메모리 거버넌스 벤치마킹

AOHP: 개인화된, 효율적이며 안전한 상호작용을 위한 오픈소스 OS 수준 Agent 하니스

MemGUI-Agent: 선제적 컨텍스트 관리를 갖춘 엔드투엔드 장기 모바일 GUI Agent

MobileForge: 계층적 피드백 유도 정책 최적화를 통한 모바일 GUI Agents를 위한 주석 없는 적응

NatureBench: 코딩 Agents가 Nature 계열 논문의 발표된 SOTA와 맞먹을 수 있는가?

Qwen-AgentWorld: 범용 agents를 위한 언어 세계 모델

보편적 음성 향상(Rethinking Training Targets, Architectures and Data Quality for Universal Speech Enhancement)

학습된 밀도 제어를 갖춘 생성형 3D 가우시안

TADA: 텍스트-음향 이중 정렬을 통한 음성 모델링을 위한 생성적 프레임워크

고립된 단어 그 이상의 세계: 손글씨 텍스트라인 생성을 위한 Diffusion Brush

gsplat: 가우시안 스플래팅을 위한 오픈소스 라이브러리

OmniVideo-100K: 구조화된 스크립트와 증거 체인을 통한 오디오-비주얼 추론을 위한 데이터셋

OPEN-SWE-TRACES: 소프트웨어 엔지니어링 에이전트를 위한 이중 모드 다국어 지식 증류의 고도화

언어 모델 추론에서 리셋이 포함된 크레딧 할당

무제한 OCR 작업 가능: 원샷 장기 파싱의 시대 환영

PlanBench-XL: 대규모 도구 생태계에서 LLM 도구 사용 Agents의 장기 계획 평가

OpenRath: Agent 시스템을 위한 세션 중심의 런타임 상태

EvoEmbedding: 긴 컨텍스트 검색 및 Agentic 메모리를 위한 진화 가능한 표현

자신의 실수로부터 배우기: 자기 증류를 위한 학습 가능한 미세 반성 궤적 구성하기

세계 행동 모델: 조사

KaLM-Reranker-V1: 압축 문서 재순위 매기기를 위한 빠르지만 후기 상호작용이 아닌

LLM FP4 사전학습에서 수축 편향 재고찰: 기하학적 기원, 체계적 영향, 및 UFP4 레시피

HydraHead: 헤드 수준의 기능적 이질성에서 전문화된 어텐션 혼합으로

3DCodeBench: 코드를 통한 Agentic Procedural 3D 모델링 벤치마킹

RadImageNet-VQA: 방사학 시각 질문 답변을 위한 대규모 CT 및 MRI 데이터셋

SWE-Gym을 활용한 소프트웨어 엔지니어링 에이전트 및 검증자의 훈련

MAKIEVAL: LLMs에 대한 문화적 인식 평가를 위한 다국어 자동 WiKIdata 기반 프레임워크

GeneralVLA-2: 로봇 계획을 위한 기하학적 인식 재구성 및 통제된 메모리

다중 턴 성찰적 마스킹이 마스크 디퓨전 모델에서 추론을 이끌어낸다

BrainG3N: 제어 가능한 3D 뇌 MRI 생성을 위한 이중 목적 토크나이저

GateMem: 다중 원리자 공유 메모리 Agents에서의 메모리 거버넌스 벤치마킹