HyperAI超神经

Uni-MoE-2.0-Omni：基于先进MoE、训练与数据的面向语言中心的全模态大模型扩展

统一多模态

LLM

Yunxin Li, Xinyu Chen, Shenyuan Jiang, et al.

P1：基于强化学习的物理奥林匹克竞赛攻关

推理

LLM

Jiacheng Chen, Qianjia Cheng, Fangchen Yu, et al.

计算机视觉

神经网络

Siyang Jiang, Hao Yang, Qipeng Xie, et al.

扩散模型

图像生成

Minglei Shi, Haolin Wang, Wenzhao Zheng, et al.

视觉问答

强化学习

Sicheng Feng, Kaiwen Tuo, Song Wang, et al.

强化学习

扩散模型

Tonghe Zhang, Chao Yu, Sichang Su, et al.

基准

音频和语音处理

Yueqian Lin, Zhengmian Hu, Qinsi Wang, et al.

强化学习

Agent

Shulin Liu, Dong Du, Tao Yang, et al.

Transformer

模型训练

Seed, Baisheng Li, Banggu Wu, et al.

LLM

多模态

Yuqi Yin, Yibo Fu, Siyuan Wang, et al.

代码生成

LLM

Zhen Yang, Wenyi Hong, Mingde Xu, et al.

多模态

统一多模态

Jingxuan Wei, Caijun Jia, Xi Bai, et al.

统一多模态

图像生成

Wei Chow, Jiachun Pan, Yongyuan Liang, et al.

Transformer

LLM

Jing Xiong, Liyang Fan, Hui Shen, et al.

模型训练

安防

Yang Li, Chunhe Xia, Chang Li, et al.

视频理解

视频处理

Xu Zhao, Ruibo Ma, Jiaqi Chen, et al.

强化学习

模型训练

Yixian Zhang, Shu'ang Yu, Tonghe Zhang, et al.

Transformer

多模态表征

Xiaojun Jia, Sensen Gao, Simeng Qin, et al.

LLM

强化学习

Nikolay Blagoev, Oğuzhan Ersoy, Lydia Yiyu Chen

LLM

偏好

Tianzhu Ye, Li Dong, Zewen Chi, et al.

视频理解

统一多模态

Zhengyang Liang, Daoan Zhang, Huichi Zhou, et al.

视频生成

Agent

PAN Team Institute of Foundation Models, Jiannan Xiang, Yi Gu, et al.

扩散模型

图像生成

Aleksandr Razin, Danil Kazantsev, Ilya Makarov

目标检测

目标跟踪

Mengqi Lei, Siqi Li, Yihong Wu, et al.

文档理解

OCR

Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir

算法

LLM

Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir

自动驾驶

基准

Dingji Wang, You Lu, Bihuan Chen, et al.

强化学习

机器人技术

Fangqi Zhu, Zhengyang Yan, Zicong Hong, et al.

LLM

模型训练

Kangning Zhang, Wenxiang Jiao, Kounianhua Du, et al.

检索增强生成

推理

Shreyas Rajesh, Pavan Holur, Chenda Duan, et al.

扩散模型

Transformer

Jingyu Liu, Xin Dong, Zhifan Ye, et al.

图生视频

扩散模型

Assaf Singer, Noam Rotstein, Amir Mann, et al.

Uni-MoE-2.0-Omni：基于先进MoE、训练与数据的面向语言中心的全模态大模型扩展

统一多模态

LLM

Yunxin Li, Xinyu Chen, Shenyuan Jiang, et al.

P1：基于强化学习的物理奥林匹克竞赛攻关

推理

LLM

Jiacheng Chen, Qianjia Cheng, Fangchen Yu, et al.

计算机视觉

神经网络

Siyang Jiang, Hao Yang, Qipeng Xie, et al.

扩散模型

图像生成

Minglei Shi, Haolin Wang, Wenzhao Zheng, et al.

视觉问答

强化学习

Sicheng Feng, Kaiwen Tuo, Song Wang, et al.

强化学习

扩散模型

Tonghe Zhang, Chao Yu, Sichang Su, et al.

基准

音频和语音处理

Yueqian Lin, Zhengmian Hu, Qinsi Wang, et al.

强化学习

Agent

Shulin Liu, Dong Du, Tao Yang, et al.

Transformer

模型训练

Seed, Baisheng Li, Banggu Wu, et al.

LLM

多模态

Yuqi Yin, Yibo Fu, Siyuan Wang, et al.

代码生成

LLM

Zhen Yang, Wenyi Hong, Mingde Xu, et al.

多模态

统一多模态

Jingxuan Wei, Caijun Jia, Xi Bai, et al.

统一多模态

图像生成

Wei Chow, Jiachun Pan, Yongyuan Liang, et al.

Transformer

LLM

Jing Xiong, Liyang Fan, Hui Shen, et al.

模型训练

安防

Yang Li, Chunhe Xia, Chang Li, et al.

视频理解

视频处理

Xu Zhao, Ruibo Ma, Jiaqi Chen, et al.

强化学习

模型训练

Yixian Zhang, Shu'ang Yu, Tonghe Zhang, et al.

Transformer

多模态表征

Xiaojun Jia, Sensen Gao, Simeng Qin, et al.

LLM

强化学习

Nikolay Blagoev, Oğuzhan Ersoy, Lydia Yiyu Chen

LLM

偏好

Tianzhu Ye, Li Dong, Zewen Chi, et al.

视频理解

统一多模态

Zhengyang Liang, Daoan Zhang, Huichi Zhou, et al.

视频生成

Agent

PAN Team Institute of Foundation Models, Jiannan Xiang, Yi Gu, et al.

扩散模型

图像生成

Aleksandr Razin, Danil Kazantsev, Ilya Makarov

目标检测

目标跟踪

Mengqi Lei, Siqi Li, Yihong Wu, et al.

文档理解

OCR

Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir

算法

LLM

Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir

自动驾驶

基准

Dingji Wang, You Lu, Bihuan Chen, et al.

强化学习

机器人技术

Fangqi Zhu, Zhengyang Yan, Zicong Hong, et al.

LLM

模型训练

Kangning Zhang, Wenxiang Jiao, Kounianhua Du, et al.

检索增强生成

推理

Shreyas Rajesh, Pavan Holur, Chenda Duan, et al.

扩散模型

Transformer

Jingyu Liu, Xin Dong, Zhifan Ye, et al.

图生视频

扩散模型

Assaf Singer, Noam Rotstein, Amir Mann, et al.

Lancelot：面向高效且隐私保护的拜占庭鲁棒联邦学习的全同态加密框架

无需变分自编码器的潜在扩散模型

RewardMap：通过多阶段强化学习应对细粒度视觉推理中的稀疏奖励

ReinFlow：通过在线强化学习微调流匹配策略

推理能力的语音评估：诊断模态诱导的性能差距

MarsRL：通过代理流水线并行化的强化学习推进多Agent推理系统

虚拟宽度网络

AIonopedia：一个由 LLM Agent 驱动的多模态学习系统，用于离子液体的发现

UI2CodeN：一种支持测试时可扩展的交互式UI到代码生成的视觉语言模型

GGBench：面向统一多模态模型的几何生成推理基准

WEAVE：释放并基准测试上下文交错理解与生成能力

DoPE：去噪旋转位置嵌入

BRFL：一种基于区块链的拜占庭鲁棒联邦学习模型

基于指数-高斯混合网络的视频观看时长预测多粒度分布建模

SAC Flow：通过速度重参数化序列建模实现基于流策略的样本高效强化学习

针对闭源MLLM的对抗攻击通过特征最优对齐

Hail to the Thief：探索去中心化GRPO中的攻击与防御

大语言模型的黑盒策略蒸馏

UniVA：面向开源下一代视频通用智能体的通用视频代理

PAN：一种通用、可交互且长时程世界模拟的世界模型

潜空间的一小步，像素空间的一大步：适用于扩散模型的快速潜空间上采样适配器

YOLOv13：基于超图增强的自适应视觉感知实时目标检测

MonkeyOCR：基于结构识别关系三元组范式的文档解析

更安全的生成式AI的共识采样

Argus：面向端到端ADS的韧性导向安全保证框架

基于世界模型的策略优化用于视觉-语言-动作模型

LoopTool：用于鲁棒LLM工具调用的数据-训练闭环

超越事实检索：基于生成语义空间的RAG情景记忆

TiDAR：在扩散中思考，在自回归中表达

Time-to-Move：通过双时钟去噪实现无需训练的运动控制视频生成

Lancelot：面向高效且隐私保护的拜占庭鲁棒联邦学习的全同态加密框架

无需变分自编码器的潜在扩散模型

RewardMap：通过多阶段强化学习应对细粒度视觉推理中的稀疏奖励

ReinFlow：通过在线强化学习微调流匹配策略

推理能力的语音评估：诊断模态诱导的性能差距

MarsRL：通过代理流水线并行化的强化学习推进多Agent推理系统

虚拟宽度网络

AIonopedia：一个由 LLM Agent 驱动的多模态学习系统，用于离子液体的发现

UI2CodeN：一种支持测试时可扩展的交互式UI到代码生成的视觉语言模型

GGBench：面向统一多模态模型的几何生成推理基准

WEAVE：释放并基准测试上下文交错理解与生成能力

DoPE：去噪旋转位置嵌入

BRFL：一种基于区块链的拜占庭鲁棒联邦学习模型

基于指数-高斯混合网络的视频观看时长预测多粒度分布建模

SAC Flow：通过速度重参数化序列建模实现基于流策略的样本高效强化学习

针对闭源MLLM的对抗攻击通过特征最优对齐

Hail to the Thief：探索去中心化GRPO中的攻击与防御

大语言模型的黑盒策略蒸馏

UniVA：面向开源下一代视频通用智能体的通用视频代理

PAN：一种通用、可交互且长时程世界模拟的世界模型

潜空间的一小步，像素空间的一大步：适用于扩散模型的快速潜空间上采样适配器

YOLOv13：基于超图增强的自适应视觉感知实时目标检测

MonkeyOCR：基于结构识别关系三元组范式的文档解析

更安全的生成式AI的共识采样

Argus：面向端到端ADS的韧性导向安全保证框架

基于世界模型的策略优化用于视觉-语言-动作模型

LoopTool：用于鲁棒LLM工具调用的数据-训练闭环

超越事实检索：基于生成语义空间的RAG情景记忆

TiDAR：在扩散中思考，在自回归中表达

Time-to-Move：通过双时钟去噪实现无需训练的运动控制视频生成

Command Palette

论文

Command Palette

论文

Command Palette

论文