HyperAI超神经

AOrchestra：面向智能体编排的子智能体自动生成

Agent

智能问答

Jianhao Ruan, Zhihao Xu, Yiran Peng, et al.

思维链中缺乏全局规划：揭示LLM的潜在规划时域

LLM

推理

Liyan Xu, Mo Yu, Fandong Meng, et al.

多模态

OCR

Yuling Shi, Chaoxiang Xie, Zhensu Sun, et al.

Agent

LLM

Yinger Zhang, Shutong Jiang, Renhao Li, et al.

LLM

智能问答

Shihan Dou, Ming Zhang, Zhangyue Yin, et al.

强化学习

检索增强生成

Jonas Hübotter, Frederike Lübeck, Lejs Behric, et al.

人机交互

心理

Rose E. Guingrich, Michael S. A. Graziano

强化学习

推理

Yuxiao Qu, Amrith Setlur, Virginia Smith, et al.

文生图

多模态

Dianyi Wang, Chaofan Ma, Feng Han, et al.

代码生成

多模态表征

Jane Luo, Chengyu Yin, Xin Zhang, et al.

视觉问答

多模态

Yu Zeng, Wenxuan Huang, Zhen Fang, et al.

检索增强生成

视觉问答

Wenxuan Huang, Yu Zeng, Qiuchen Wang, et al.

多模态

多模态表征

Kimi Team, Tongtong Bai, Yifan Bai, et al.

多模态

统一多模态

I. Apanasevich, M. Artemyev, R. Babakyan, et al.

文生图

AI for Science

Dawei Zhu, Rui Meng, Yale Song, et al.

AI for Science

数学

Tony Feng, Trieu Trinh, Garrett Bingham, et al.

LLM

推理

Jiecong Wang, Hao Peng, Chunyang Liu

强化学习

LLM

Zixuan Huang, Xin Xia, Yuxi Ren, et al.

扩散模型

监督式微调

Haoyou Deng, Keyu Yan, Chaojie Mao, et al.

视频生成

图生视频

Mingshuang Luo, Shuang Liang, Zhengkun Rong, et al.

LLM

推理

Chengyi Yang, Zhishang Xiang, Yunbo Tang, et al.

强化学习

LLM

Xiaoyu Tian, Haotian Wang, Shuaiting Chen, et al.

强化学习

监督式微调

Idan Shenfeld, Mehul Damani, Jonas Hübotter, et al.

LLM

算法

Chenglei Si, Zitong Yang, Yejin Choi, et al.

机器人技术

具身智能

Haozhe Xie, Beichen Wen, Jiarui Zheng, et al.

推理

数据集

Honglin Lin, Zheng Liu, Yun Zhu, et al.

OCR

文档理解

Yufeng Zhong, Lei Chen, Xuanle Zhao, et al.

检索增强生成

Transformer

Hong Liu, Jiaqi Zhang, Chao Wang, et al.

Agent

LLM

Tengyue Xu, Zhuoyang Qian, Gaoge Liu, et al.

文生图

扩散模型

Zengbin Wang, Xuecai Hu, Yong Wang, et al.

音频和语音处理

LLM

Xian Shi, Xiong Wang, Zhifang Guo, et al.

Agent

智能问答

Jincheng Bai, Zhenyu Zhang, Jennifer Zhang, et al.

AOrchestra：面向智能体编排的子智能体自动生成

Agent

智能问答

Jianhao Ruan, Zhihao Xu, Yiran Peng, et al.

思维链中缺乏全局规划：揭示LLM的潜在规划时域

LLM

推理

Liyan Xu, Mo Yu, Fandong Meng, et al.

多模态

OCR

Yuling Shi, Chaoxiang Xie, Zhensu Sun, et al.

Agent

LLM

Yinger Zhang, Shutong Jiang, Renhao Li, et al.

LLM

智能问答

Shihan Dou, Ming Zhang, Zhangyue Yin, et al.

强化学习

检索增强生成

Jonas Hübotter, Frederike Lübeck, Lejs Behric, et al.

人机交互

心理

Rose E. Guingrich, Michael S. A. Graziano

强化学习

推理

Yuxiao Qu, Amrith Setlur, Virginia Smith, et al.

文生图

多模态

Dianyi Wang, Chaofan Ma, Feng Han, et al.

代码生成

多模态表征

Jane Luo, Chengyu Yin, Xin Zhang, et al.

视觉问答

多模态

Yu Zeng, Wenxuan Huang, Zhen Fang, et al.

检索增强生成

视觉问答

Wenxuan Huang, Yu Zeng, Qiuchen Wang, et al.

多模态

多模态表征

Kimi Team, Tongtong Bai, Yifan Bai, et al.

多模态

统一多模态

I. Apanasevich, M. Artemyev, R. Babakyan, et al.

文生图

AI for Science

Dawei Zhu, Rui Meng, Yale Song, et al.

AI for Science

数学

Tony Feng, Trieu Trinh, Garrett Bingham, et al.

LLM

推理

Jiecong Wang, Hao Peng, Chunyang Liu

强化学习

LLM

Zixuan Huang, Xin Xia, Yuxi Ren, et al.

扩散模型

监督式微调

Haoyou Deng, Keyu Yan, Chaojie Mao, et al.

视频生成

图生视频

Mingshuang Luo, Shuang Liang, Zhengkun Rong, et al.

LLM

推理

Chengyi Yang, Zhishang Xiang, Yunbo Tang, et al.

强化学习

LLM

Xiaoyu Tian, Haotian Wang, Shuaiting Chen, et al.

强化学习

监督式微调

Idan Shenfeld, Mehul Damani, Jonas Hübotter, et al.

LLM

算法

Chenglei Si, Zitong Yang, Yejin Choi, et al.

机器人技术

具身智能

Haozhe Xie, Beichen Wen, Jiarui Zheng, et al.

推理

数据集

Honglin Lin, Zheng Liu, Yun Zhu, et al.

OCR

文档理解

Yufeng Zhong, Lei Chen, Xuanle Zhao, et al.

检索增强生成

Transformer

Hong Liu, Jiaqi Zhang, Chao Wang, et al.

Agent

LLM

Tengyue Xu, Zhuoyang Qian, Gaoge Liu, et al.

文生图

扩散模型

Zengbin Wang, Xuecai Hu, Yong Wang, et al.

音频和语音处理

LLM

Xian Shi, Xiong Wang, Zhifang Guo, et al.

Agent

智能问答

Jincheng Bai, Zhenyu Zhang, Jennifer Zhang, et al.

CodeOCR：视觉语言模型在代码理解中的有效性研究

DeepPlanning：基于可验证约束的长时域Agent规划基准测试

CL-bench：上下文学习基准

基于自蒸馏的强化学习

聊天机器人作为社交伴侣：人们如何感知机器的意识、类人程度以及社交健康益处

POPE：通过特权在策略探索学习在难题上进行推理

UniReason 1.0：面向世界知识对齐的图像生成与编辑的统一推理框架

闭环闭环：基于RPG-Encoder的通用仓库表示

视觉-DeepResearch基准：重新思考多模态大语言模型中的视觉与文本搜索

Vision-DeepResearch：在多模态大语言模型中激励深度研究能力

Kimi K2.5：视觉智能体智能

Green-VLA：面向通用机器人的分阶段视觉-语言-动作模型

PaperBanana：为AI科学家自动化学术插图

使用Gemini的半自主数学发现：Erdős问题案例研究

潜在思维链作为规划：将推理与语言化分离

实时对齐的奖励模型：超越语义

DenseGRPO：从稀疏到密集奖励用于流匹配模型对齐

DreamActor-M2：通过时空上下文学习实现通用角色图像动画

TTCS：用于自演化系统的测试时课程合成

ASTRA：智能体轨迹与强化环境的自动化合成

自蒸馏实现持续学习

面向执行基础的自动化AI研究

DynamicVLA：一种用于动态物体操作的视觉-语言-动作模型

MMFineReason：通过开放数据驱动方法弥合多模态推理差距

OCRVerse：迈向端到端视觉-语言模型中的全面OCR

扩展嵌入空间在语言模型中的表现优于扩展专家模型

Idea2Story：一种将研究概念自动转化为完整科学叙事的流水线

各归其位：文本到图像模型空间智能的基准测试

Qwen3-ASR 技术报告

Insight Agents：一种基于LLM的多代理数据洞察系统

CodeOCR：视觉语言模型在代码理解中的有效性研究

DeepPlanning：基于可验证约束的长时域Agent规划基准测试

CL-bench：上下文学习基准

基于自蒸馏的强化学习

聊天机器人作为社交伴侣：人们如何感知机器的意识、类人程度以及社交健康益处

POPE：通过特权在策略探索学习在难题上进行推理

UniReason 1.0：面向世界知识对齐的图像生成与编辑的统一推理框架

闭环闭环：基于RPG-Encoder的通用仓库表示

视觉-DeepResearch基准：重新思考多模态大语言模型中的视觉与文本搜索

Vision-DeepResearch：在多模态大语言模型中激励深度研究能力

Kimi K2.5：视觉智能体智能

Green-VLA：面向通用机器人的分阶段视觉-语言-动作模型

PaperBanana：为AI科学家自动化学术插图

使用Gemini的半自主数学发现：Erdős问题案例研究

潜在思维链作为规划：将推理与语言化分离

实时对齐的奖励模型：超越语义

DenseGRPO：从稀疏到密集奖励用于流匹配模型对齐

DreamActor-M2：通过时空上下文学习实现通用角色图像动画

TTCS：用于自演化系统的测试时课程合成

ASTRA：智能体轨迹与强化环境的自动化合成

自蒸馏实现持续学习

面向执行基础的自动化AI研究

DynamicVLA：一种用于动态物体操作的视觉-语言-动作模型

MMFineReason：通过开放数据驱动方法弥合多模态推理差距

OCRVerse：迈向端到端视觉-语言模型中的全面OCR

扩展嵌入空间在语言模型中的表现优于扩展专家模型

Idea2Story：一种将研究概念自动转化为完整科学叙事的流水线

各归其位：文本到图像模型空间智能的基准测试

Qwen3-ASR 技术报告

Insight Agents：一种基于LLM的多代理数据洞察系统

Command Palette

论文

Command Palette

论文

Command Palette

论文