HyperAI
HyperAI超神经
首页
算力平台
文档
资讯
论文
教程
数据集
百科
SOTA
LLM 模型天梯
GPU 天梯
顶会
开源项目
全站搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI超神经
Toggle Sidebar
全站搜索…
⌘
K
Command Palette
Search for a command to run...
算力平台
首页
论文
论文
每日更新的前沿 AI 研究论文,助您把握人工智能最新动向
论文 | HyperAI超神经
MMaDA-Parallel:面向思维感知编辑与生成的多模态大扩散语言模型
Ye Tian, Ling Yang, Jiongfan Yang, et al.
TiViBench:面向视频生成模型的视频思维推理基准测试
Harold Haodong Chen, Disen Lan, Wen-Jie Shu, et al.
Part-X-MLLM:面向部件感知的3D多模态大语言模型
Chunshi Wang, Junliang Ye, Yunhan Yang, et al.
Uni-MoE-2.0-Omni:基于先进MoE、训练与数据的面向语言中心的全模态大模型扩展
Yunxin Li, Xinyu Chen, Shenyuan Jiang, et al.
P1:基于强化学习的物理奥林匹克竞赛攻关
Jiacheng Chen, Qianjia Cheng, Fangchen Yu, et al.
Lancelot:面向高效且隐私保护的拜占庭鲁棒联邦学习的全同态加密框架
Siyang Jiang, Hao Yang, Qipeng Xie, et al.
无需变分自编码器的潜在扩散模型
Minglei Shi, Haolin Wang, Wenzhao Zheng, et al.
RewardMap:通过多阶段强化学习应对细粒度视觉推理中的稀疏奖励
Sicheng Feng, Kaiwen Tuo, Song Wang, et al.
ReinFlow:通过在线强化学习微调流匹配策略
Tonghe Zhang, Chao Yu, Sichang Su, et al.
推理能力的语音评估:诊断模态诱导的性能差距
Yueqian Lin, Zhengmian Hu, Qinsi Wang, et al.
MarsRL:通过代理流水线并行化的强化学习推进多Agent推理系统
Shulin Liu, Dong Du, Tao Yang, et al.
虚拟宽度网络
Seed, Baisheng Li, Banggu Wu, et al.
AIonopedia:一个由 LLM Agent 驱动的多模态学习系统,用于离子液体的发现
Yuqi Yin, Yibo Fu, Siyuan Wang, et al.
UI2CodeN:一种支持测试时可扩展的交互式UI到代码生成的视觉语言模型
Zhen Yang, Wenyi Hong, Mingde Xu, et al.
GGBench:面向统一多模态模型的几何生成推理基准
Jingxuan Wei, Caijun Jia, Xi Bai, et al.
WEAVE:释放并基准测试上下文交错理解与生成能力
Wei Chow, Jiachun Pan, Yongyuan Liang, et al.
DoPE:去噪旋转位置嵌入
Jing Xiong, Liyang Fan, Hui Shen, et al.
BRFL:一种基于区块链的拜占庭鲁棒联邦学习模型
Yang Li, Chunhe Xia, Chang Li, et al.
基于指数-高斯混合网络的视频观看时长预测多粒度分布建模
Xu Zhao, Ruibo Ma, Jiaqi Chen, et al.
SAC Flow:通过速度重参数化序列建模实现基于流策略的样本高效强化学习
Yixian Zhang, Shu'ang Yu, Tonghe Zhang, et al.
针对闭源MLLM的对抗攻击通过特征最优对齐
Xiaojun Jia, Sensen Gao, Simeng Qin, et al.
Hail to the Thief:探索去中心化GRPO中的攻击与防御
Nikolay Blagoev, Oğuzhan Ersoy, Lydia Yiyu Chen
Depth Anything 3:从任意视角恢复视觉空间
Haotong Lin, Sili Chen, Junhao Liew, et al.
大语言模型的黑盒策略蒸馏
Tianzhu Ye, Li Dong, Zewen Chi, et al.
UniVA:面向开源下一代视频通用智能体的通用视频代理
Zhengyang Liang, Daoan Zhang, Huichi Zhou, et al.
PAN:一种通用、可交互且长时程世界模拟的世界模型
PAN Team Institute of Foundation Models, Jiannan Xiang, Yi Gu, et al.
潜空间的一小步,像素空间的一大步:适用于扩散模型的快速潜空间上采样适配器
Aleksandr Razin, Danil Kazantsev, Ilya Makarov
YOLOv13:基于超图增强的自适应视觉感知实时目标检测
Mengqi Lei, Siqi Li, Yihong Wu, et al.
MonkeyOCR:基于结构识别关系三元组范式的文档解析
Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir
更安全的生成式AI的共识采样
Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir
Argus:面向端到端ADS的韧性导向安全保证框架
Dingji Wang, You Lu, Bihuan Chen, et al.
基于世界模型的策略优化用于视觉-语言-动作模型
Fangqi Zhu, Zhengyang Yan, Zicong Hong, et al.
1
2
3
4
5
6
35