HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
推理能力的语音评估:诊断模态诱导的性能差距
基准
音频和语音处理
Yueqian Lin, Zhengmian Hu, Qinsi Wang, et al.
MarsRL:通过代理流水线并行化的强化学习推进多Agent推理系统
强化学习
Agent
Shulin Liu, Dong Du, Tao Yang, et al.
虚拟宽度网络
Transformer
模型训练
Seed, Baisheng Li, Banggu Wu, et al.
AIonopedia:一个由 LLM Agent 驱动的多模态学习系统,用于离子液体的发现
LLM
多模态
Yuqi Yin, Yibo Fu, Siyuan Wang, et al.
UI2CodeN:一种支持测试时可扩展的交互式UI到代码生成的视觉语言模型
代码生成
LLM
Zhen Yang, Wenyi Hong, Mingde Xu, et al.
GGBench:面向统一多模态模型的几何生成推理基准
多模态
统一多模态
Jingxuan Wei, Caijun Jia, Xi Bai, et al.
WEAVE:释放并基准测试上下文交错理解与生成能力
统一多模态
图像生成
Wei Chow, Jiachun Pan, Yongyuan Liang, et al.
DoPE:去噪旋转位置嵌入
Transformer
LLM
Jing Xiong, Liyang Fan, Hui Shen, et al.
BRFL:一种基于区块链的拜占庭鲁棒联邦学习模型
模型训练
安防
Yang Li, Chunhe Xia, Chang Li, et al.
基于指数-高斯混合网络的视频观看时长预测多粒度分布建模
视频理解
视频处理
Xu Zhao, Ruibo Ma, Jiaqi Chen, et al.
SAC Flow:通过速度重参数化序列建模实现基于流策略的样本高效强化学习
强化学习
模型训练
Yixian Zhang, Shu'ang Yu, Tonghe Zhang, et al.
针对闭源MLLM的对抗攻击通过特征最优对齐
Transformer
多模态表征
Xiaojun Jia, Sensen Gao, Simeng Qin, et al.
Hail to the Thief:探索去中心化GRPO中的攻击与防御
LLM
强化学习
Nikolay Blagoev, Oğuzhan Ersoy, Lydia Yiyu Chen
大语言模型的黑盒策略蒸馏
LLM
偏好
Tianzhu Ye, Li Dong, Zewen Chi, et al.
UniVA:面向开源下一代视频通用智能体的通用视频代理
视频理解
统一多模态
Zhengyang Liang, Daoan Zhang, Huichi Zhou, et al.
PAN:一种通用、可交互且长时程世界模拟的世界模型
视频生成
Agent
PAN Team Institute of Foundation Models, Jiannan Xiang, Yi Gu, et al.
潜空间的一小步,像素空间的一大步:适用于扩散模型的快速潜空间上采样适配器
扩散模型
图像生成
Aleksandr Razin, Danil Kazantsev, Ilya Makarov
YOLOv13:基于超图增强的自适应视觉感知实时目标检测
目标检测
目标跟踪
Mengqi Lei, Siqi Li, Yihong Wu, et al.
MonkeyOCR:基于结构识别关系三元组范式的文档解析
文档理解
OCR
Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir
更安全的生成式AI的共识采样
算法
LLM
Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir
Argus:面向端到端ADS的韧性导向安全保证框架
自动驾驶
基准
Dingji Wang, You Lu, Bihuan Chen, et al.
基于世界模型的策略优化用于视觉-语言-动作模型
强化学习
机器人技术
Fangqi Zhu, Zhengyang Yan, Zicong Hong, et al.
LoopTool:用于鲁棒LLM工具调用的数据-训练闭环
LLM
模型训练
Kangning Zhang, Wenxiang Jiao, Kounianhua Du, et al.
超越事实检索:基于生成语义空间的RAG情景记忆
检索增强生成
推理
Shreyas Rajesh, Pavan Holur, Chenda Duan, et al.
TiDAR:在扩散中思考,在自回归中表达
扩散模型
Transformer
Jingyu Liu, Xin Dong, Zhifan Ye, et al.
Time-to-Move:通过双时钟去噪实现无需训练的运动控制视频生成
图生视频
扩散模型
Assaf Singer, Noam Rotstein, Amir Mann, et al.
Lumine:在3D开放世界中构建通用Agent的开源方案
Agent
推理
Weihao Tan, Xiangyang Li, Yunhao Fang, et al.
从1,000个词生成一张图像:通过结构化描述增强文本到图像生成
文生图
图像生成
Eyal Gutflaish, Eliran Kachlon, Hezi Zisman, et al.
KLASS:基于KL引导的掩码扩散模型快速推理
扩散模型
自然语言处理
Seo Hyun Kim, Sunwoo Hong, Hojung Jung, et al.
基于人类示范的计算机使用Agent定位
数据集
文档理解
Aarash Feizi, Shravan Nayak, Xiangru Jian, et al.
Wasm:构建结构化阿拉伯语交错多模态语料库的流水线
多模态
数据集
Khalil Hennara, Ahmad Bastati, Muhammad Hreden, et al.
对话系统中的自适应多智能体响应优化
Agent
LLM
Soyeong Jeong, Aparna Elangovan, Emine Yilmaz, et al.
1
15
16
17
18
19
20
21
49
推理能力的语音评估:诊断模态诱导的性能差距
基准
音频和语音处理
Yueqian Lin, Zhengmian Hu, Qinsi Wang, et al.
MarsRL:通过代理流水线并行化的强化学习推进多Agent推理系统
强化学习
Agent
Shulin Liu, Dong Du, Tao Yang, et al.
虚拟宽度网络
Transformer
模型训练
Seed, Baisheng Li, Banggu Wu, et al.
AIonopedia:一个由 LLM Agent 驱动的多模态学习系统,用于离子液体的发现
LLM
多模态
Yuqi Yin, Yibo Fu, Siyuan Wang, et al.
UI2CodeN:一种支持测试时可扩展的交互式UI到代码生成的视觉语言模型
代码生成
LLM
Zhen Yang, Wenyi Hong, Mingde Xu, et al.
GGBench:面向统一多模态模型的几何生成推理基准
多模态
统一多模态
Jingxuan Wei, Caijun Jia, Xi Bai, et al.
WEAVE:释放并基准测试上下文交错理解与生成能力
统一多模态
图像生成
Wei Chow, Jiachun Pan, Yongyuan Liang, et al.
DoPE:去噪旋转位置嵌入
Transformer
LLM
Jing Xiong, Liyang Fan, Hui Shen, et al.
BRFL:一种基于区块链的拜占庭鲁棒联邦学习模型
模型训练
安防
Yang Li, Chunhe Xia, Chang Li, et al.
基于指数-高斯混合网络的视频观看时长预测多粒度分布建模
视频理解
视频处理
Xu Zhao, Ruibo Ma, Jiaqi Chen, et al.
SAC Flow:通过速度重参数化序列建模实现基于流策略的样本高效强化学习
强化学习
模型训练
Yixian Zhang, Shu'ang Yu, Tonghe Zhang, et al.
针对闭源MLLM的对抗攻击通过特征最优对齐
Transformer
多模态表征
Xiaojun Jia, Sensen Gao, Simeng Qin, et al.
Hail to the Thief:探索去中心化GRPO中的攻击与防御
LLM
强化学习
Nikolay Blagoev, Oğuzhan Ersoy, Lydia Yiyu Chen
大语言模型的黑盒策略蒸馏
LLM
偏好
Tianzhu Ye, Li Dong, Zewen Chi, et al.
UniVA:面向开源下一代视频通用智能体的通用视频代理
视频理解
统一多模态
Zhengyang Liang, Daoan Zhang, Huichi Zhou, et al.
PAN:一种通用、可交互且长时程世界模拟的世界模型
视频生成
Agent
PAN Team Institute of Foundation Models, Jiannan Xiang, Yi Gu, et al.
潜空间的一小步,像素空间的一大步:适用于扩散模型的快速潜空间上采样适配器
扩散模型
图像生成
Aleksandr Razin, Danil Kazantsev, Ilya Makarov
YOLOv13:基于超图增强的自适应视觉感知实时目标检测
目标检测
目标跟踪
Mengqi Lei, Siqi Li, Yihong Wu, et al.
MonkeyOCR:基于结构识别关系三元组范式的文档解析
文档理解
OCR
Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir
更安全的生成式AI的共识采样
算法
LLM
Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir
Argus:面向端到端ADS的韧性导向安全保证框架
自动驾驶
基准
Dingji Wang, You Lu, Bihuan Chen, et al.
基于世界模型的策略优化用于视觉-语言-动作模型
强化学习
机器人技术
Fangqi Zhu, Zhengyang Yan, Zicong Hong, et al.
LoopTool:用于鲁棒LLM工具调用的数据-训练闭环
LLM
模型训练
Kangning Zhang, Wenxiang Jiao, Kounianhua Du, et al.
超越事实检索:基于生成语义空间的RAG情景记忆
检索增强生成
推理
Shreyas Rajesh, Pavan Holur, Chenda Duan, et al.
TiDAR:在扩散中思考,在自回归中表达
扩散模型
Transformer
Jingyu Liu, Xin Dong, Zhifan Ye, et al.
Time-to-Move:通过双时钟去噪实现无需训练的运动控制视频生成
图生视频
扩散模型
Assaf Singer, Noam Rotstein, Amir Mann, et al.
Lumine:在3D开放世界中构建通用Agent的开源方案
Agent
推理
Weihao Tan, Xiangyang Li, Yunhao Fang, et al.
从1,000个词生成一张图像:通过结构化描述增强文本到图像生成
文生图
图像生成
Eyal Gutflaish, Eliran Kachlon, Hezi Zisman, et al.
KLASS:基于KL引导的掩码扩散模型快速推理
扩散模型
自然语言处理
Seo Hyun Kim, Sunwoo Hong, Hojung Jung, et al.
基于人类示范的计算机使用Agent定位
数据集
文档理解
Aarash Feizi, Shravan Nayak, Xiangru Jian, et al.
Wasm:构建结构化阿拉伯语交错多模态语料库的流水线
多模态
数据集
Khalil Hennara, Ahmad Bastati, Muhammad Hreden, et al.
对话系统中的自适应多智能体响应优化
Agent
LLM
Soyeong Jeong, Aparna Elangovan, Emine Yilmaz, et al.
1
15
16
17
18
19
20
21
49