HyperAI超神经

Ministral 3

LLM

文本生成

Alexander H. Liu, Kartik Khandelwal, Sandeep Subramanian, et al.

置信度二分法：工具使用Agent中误校准问题的分析与缓解

强化学习

Agent

Weihao Xuan, Qingcheng Zeng, Heli Qi, et al.

强化学习

偏好

Qiang Zhang, Boli Chen, Fanrui Zhang, et al.

通义千问

人机交互

Siyuan Hu, Kevin Qinghong Lin, Mike Zheng Shou

具身智能

文生视频

Quentin Garrido, Tushar Nagarajan, Basile Terver, et al.

Agent

推理

Zhenrui Yue, Kartikeya Upasani, Xianjun Yang, et al.

Transformer

图像生成

Kewei Zhang, Ye Huang, Yufan Deng, et al.

推理

智能问答

Wenhao Zeng, Xuteng Zhang, Yuling Shi, et al.

代码生成

推理

Jie Wu, Haoling Li, Xin Zhang, et al.

推理

智能问答

Jingcheng Hu, Yinmin Zhang, Shijie Shang, et al.

视觉问答

图像理解

Liang Chen, Weichu Xie, Yiyan Liang, et al.

视频理解

Agent

Chengwen Liu, Xiaomin Yu, Zhuoyue Chang, et al.

LLM

检索增强生成

Xin Cheng, Wangding Zeng, Damai Dai, et al.

Agent

LLM

Xiaoshuai Song, Haofei Chang, Guanting Dong, et al.

强化学习

Agent

Jiajie Zhang, Xin Lv, Ling Feng, et al.

3D 生成

3D 模型

Eldad Matmon, Amit Bracha, Noam Rotstein, et al.

LLM

推理

Qiguang Chen, Yantao Du, Ziniu Li, et al.

推理

统一多模态

Jing Xiong, Qi Han, Yunta Hsieh, et al.

地理信息

LLM

Yuxiang Ji, Yong Wang, Ziyu Ma, et al.

算法

高性能计算

Ran Duan, Jiayi Mao, Xiao Mao, et al.

机器人技术

具身智能

Ruoshi Wen, Guangzeng Chen, Zhongren Cui, et al.

视频理解

推理

Shuming Liu, Mingchen Zhuge, Changsheng Zhao, et al.

推理

文本生成

Chengsong Huang, Tong Zheng, Langlin Huang, et al.

LLM

文本生成

Nuoya Xiong, Yuhang Zhou, Hanqing Zeng, et al.

图像处理

机器视觉

Yuan-Kang Lee, Kuan-Lin Chen, Chia-Che Chang, et al.

Transformer

机器学习

Maksim Velikanov, Ilyas Chahed, Jingwei Zuo, et al.

强化学习

偏好

Shih-Yang Liu, Xin Dong, Ximing Lu, et al.

强化学习

Agent

Shengtao Zhang, Jiaqian Wang, Ruiwen Zhou, et al.

Agent

推理

Bingguang Hao, Zengzhuang Xu, Yuntao Wen, et al.

视频生成

3D 生成

Yanzhe Lyu, Chen Geng, Karthik Dharmarajan, et al.

文生视频

统一多模态

Jun Wang, Chunyu Qiang, Yuxin Guo, et al.

Agent

推理

Jinyang Wu, Guocheng Zhai, Ruihan Jin, et al.

Ministral 3

LLM

文本生成

Alexander H. Liu, Kartik Khandelwal, Sandeep Subramanian, et al.

置信度二分法：工具使用Agent中误校准问题的分析与缓解

强化学习

Agent

Weihao Xuan, Qingcheng Zeng, Heli Qi, et al.

强化学习

偏好

Qiang Zhang, Boli Chen, Fanrui Zhang, et al.

通义千问

人机交互

Siyuan Hu, Kevin Qinghong Lin, Mike Zheng Shou

具身智能

文生视频

Quentin Garrido, Tushar Nagarajan, Basile Terver, et al.

Agent

推理

Zhenrui Yue, Kartikeya Upasani, Xianjun Yang, et al.

Transformer

图像生成

Kewei Zhang, Ye Huang, Yufan Deng, et al.

推理

智能问答

Wenhao Zeng, Xuteng Zhang, Yuling Shi, et al.

代码生成

推理

Jie Wu, Haoling Li, Xin Zhang, et al.

推理

智能问答

Jingcheng Hu, Yinmin Zhang, Shijie Shang, et al.

视觉问答

图像理解

Liang Chen, Weichu Xie, Yiyan Liang, et al.

视频理解

Agent

Chengwen Liu, Xiaomin Yu, Zhuoyue Chang, et al.

LLM

检索增强生成

Xin Cheng, Wangding Zeng, Damai Dai, et al.

Agent

LLM

Xiaoshuai Song, Haofei Chang, Guanting Dong, et al.

强化学习

Agent

Jiajie Zhang, Xin Lv, Ling Feng, et al.

3D 生成

3D 模型

Eldad Matmon, Amit Bracha, Noam Rotstein, et al.

LLM

推理

Qiguang Chen, Yantao Du, Ziniu Li, et al.

推理

统一多模态

Jing Xiong, Qi Han, Yunta Hsieh, et al.

地理信息

LLM

Yuxiang Ji, Yong Wang, Ziyu Ma, et al.

算法

高性能计算

Ran Duan, Jiayi Mao, Xiao Mao, et al.

机器人技术

具身智能

Ruoshi Wen, Guangzeng Chen, Zhongren Cui, et al.

视频理解

推理

Shuming Liu, Mingchen Zhuge, Changsheng Zhao, et al.

推理

文本生成

Chengsong Huang, Tong Zheng, Langlin Huang, et al.

LLM

文本生成

Nuoya Xiong, Yuhang Zhou, Hanqing Zeng, et al.

图像处理

机器视觉

Yuan-Kang Lee, Kuan-Lin Chen, Chia-Che Chang, et al.

Transformer

机器学习

Maksim Velikanov, Ilyas Chahed, Jingwei Zuo, et al.

强化学习

偏好

Shih-Yang Liu, Xin Dong, Ximing Lu, et al.

强化学习

Agent

Shengtao Zhang, Jiaqian Wang, Ruiwen Zhou, et al.

Agent

推理

Bingguang Hao, Zengzhuang Xu, Yuntao Wen, et al.

视频生成

3D 生成

Yanzhe Lyu, Chen Geng, Karthik Dharmarajan, et al.

文生视频

统一多模态

Jun Wang, Chunyu Qiang, Yuxin Guo, et al.

Agent

推理

Jinyang Wu, Guocheng Zhai, Ruihan Jin, et al.

ArenaRL：通过基于锦标赛的相对排名实现开放式智能体的强化学习扩展

ShowUI-π：基于流的生成模型作为GUI灵巧手

在野外学习潜在动作世界模型

Dr. Zero：无需训练数据的自演化搜索Agent

MHLA：通过Token级多头机制恢复线性注意力的表达能力

GlimpRouter：通过窥视一个思维token实现高效协同推理

X-Coder：基于全合成任务、解法与测试的竞赛编程新范式

PaCoRe：通过并行协同推理学习在测试时扩展计算资源

BabyVision：超越语言的视觉推理

观看、推理与搜索：面向智能体视频推理的开放网络视频深度研究基准

通过可扩展查找实现的条件记忆：大型语言模型稀疏性的一个新维度

EnvScaler：通过程序化合成实现LLM Agent的工具交互环境扩展

证据链构建：基于引用感知评分奖励的深度搜索Agent鲁棒强化学习

卡通化GS：基于高斯曲率的3D高斯溅射人脸夸张方法

思维的分子结构：长链思维推理拓扑结构的映射

MMFormalizer：开放环境中的多模态自动形式化

基于地图的思维：用于地理定位的强化并行地图增强型Agent

打破有向单源最短路径的排序障碍

GR-Dexter 技术报告

VideoAuto-R1：通过一次思考，两次作答实现视频自动推理

RelayLLM：通过协作解码实现高效推理

基于FusionRoute的Token级LLM协作

RL-AWB：基于深度强化学习的低光照夜间场景自动白平衡校正

可学习的缩放因子：释放语言模型矩阵层的规模限制

GDPO：面向多奖励强化学习优化的分组奖励解耦归一化策略优化

MemRL：通过情景记忆上的运行时强化学习实现自我演化的Agent

从失败到精通：为Tool-use Agents生成困难样本

编排一个动态物体的世界

Klear：统一的多任务音视频联合生成

Atlas：面向多领域复杂推理的异构模型与工具编排

ArenaRL：通过基于锦标赛的相对排名实现开放式智能体的强化学习扩展

ShowUI-π：基于流的生成模型作为GUI灵巧手

在野外学习潜在动作世界模型

Dr. Zero：无需训练数据的自演化搜索Agent

MHLA：通过Token级多头机制恢复线性注意力的表达能力

GlimpRouter：通过窥视一个思维token实现高效协同推理

X-Coder：基于全合成任务、解法与测试的竞赛编程新范式

PaCoRe：通过并行协同推理学习在测试时扩展计算资源

BabyVision：超越语言的视觉推理

观看、推理与搜索：面向智能体视频推理的开放网络视频深度研究基准

通过可扩展查找实现的条件记忆：大型语言模型稀疏性的一个新维度

EnvScaler：通过程序化合成实现LLM Agent的工具交互环境扩展

证据链构建：基于引用感知评分奖励的深度搜索Agent鲁棒强化学习

卡通化GS：基于高斯曲率的3D高斯溅射人脸夸张方法

思维的分子结构：长链思维推理拓扑结构的映射

MMFormalizer：开放环境中的多模态自动形式化

基于地图的思维：用于地理定位的强化并行地图增强型Agent

打破有向单源最短路径的排序障碍

GR-Dexter 技术报告

VideoAuto-R1：通过一次思考，两次作答实现视频自动推理

RelayLLM：通过协作解码实现高效推理

基于FusionRoute的Token级LLM协作

RL-AWB：基于深度强化学习的低光照夜间场景自动白平衡校正

可学习的缩放因子：释放语言模型矩阵层的规模限制

GDPO：面向多奖励强化学习优化的分组奖励解耦归一化策略优化

MemRL：通过情景记忆上的运行时强化学习实现自我演化的Agent

从失败到精通：为Tool-use Agents生成困难样本

编排一个动态物体的世界

Klear：统一的多任务音视频联合生成

Atlas：面向多领域复杂推理的异构模型与工具编排

Command Palette

论文

Command Palette

论文

Command Palette

论文