HyperAI超神经

delta-mem：大型语言模型的高效在线记忆机制

LLM

Transformer

Jingdi Lei, Di Zhang, Junxian Li, et al.

MCP-Cosmos：用于在 MCP 环境中执行复杂任务的、由世界模型增强的 Agent

Agent

LLM

Giridhar Ganapavarapu, Dhaval Patel

强化学习

LLM

Wanli Yang, Hongyu Zang, Junwei Zhang, et al.

强化学习

深度学习

Jiafei Lyu, Zichuan Lin, Scott Fujimoto, et al.

LLM

Agent

Guinan Su, Yanwu Yang, Xueyan Li, et al.

强化学习

LLM

Yunho Choi, Jongwon Lim, Woojin Ahn, et al.

扩散模型

视频生成

Weiqing Xiao, Hong Li, Xiuyu Yang, et al.

LLM

Agent

Ruben Laukkonen, Seb Krier, Chloé Bakalar, et al.

多模态

多模态表征

Kechen Fang, Yihua Qin, Chongyi Wang, et al.

推理

LLM

Mohammadreza Armandpour, Fatih Ilhan, David Harrison, et al.

LLM

文本生成

Hamid Kazemi, Atoosa Chegini, Maria Safi

LLM

Transformer

Shengkun Tang, Zekun Wang, Bo Zheng, et al.

扩散模型

文本生成

Keya Hu, Linlu Qiu, Yiyang Lu, et al.

文档理解

文生图

Bihui Yu, Xinglong Xu, Junjie Jiang, et al.

LLM

模型训练

Junfeng Fang, Zhepei Hong, Mao Zheng, et al.

视频生成

视频理解

Joowon Kim, Seungho Shin, Joonhyung Park, et al.

Agent

LLM

George Wu, Nan Jing, Qing Yi, et al.

LLM

数学

Guijin Son, Seungone Kim, Catherine Arnett, et al.

多模态

通义千问

Bing Zhao, Chenfei Wu, Deqing Li, et al.

多模态

统一多模态

Junbo Cui, Bokai Xu, Chongyi Wang, et al.

强化学习

模型训练

Yi Wang, Xincheng Li, Pengwei Xie, et al.

文本生成

扩散模型

Julie Kallini, Artidoro Pagnoni, Tomasz Limisiewicz, et al.

AI for Science

数学

Daniel Zheng, Ingrid von Glehn, Yori Zwols, et al.

Agent

检索增强生成

Guankai Li, Jiabin Chen, Yi Xu, et al.

Tong Zheng, Haolin Liu, Chengsong Huang, et al.

强化学习

LLM

Yun Qu, Qi Wang, Yixiu Mao, et al.

文生图

扩散模型

Zhen Fang, Wenxuan Huang, Yu Zeng, et al.

扩散模型

视频生成

Kaixing Yang, Jiashu Zhu, Xulong Tang, et al.

检索增强生成

推理

Yilun Zhao, Jinbiao Wei, Tingyu Song, et al.

文生视频

文生图

Rui Wang, Yue Zhang, Jiehong Lin, et al.

采用 Judge 协调的大模型集成框架「Meno and Friends」进行高真实性多轮响应生成

智能问答

文本生成

Ivan Bondarenko, Roman Derunets, Oleg Sedukhin, et al.

delta-mem：大型语言模型的高效在线记忆机制

LLM

Transformer

Jingdi Lei, Di Zhang, Junxian Li, et al.

MCP-Cosmos：用于在 MCP 环境中执行复杂任务的、由世界模型增强的 Agent

Agent

LLM

Giridhar Ganapavarapu, Dhaval Patel

强化学习

LLM

Wanli Yang, Hongyu Zang, Junwei Zhang, et al.

强化学习

深度学习

Jiafei Lyu, Zichuan Lin, Scott Fujimoto, et al.

LLM

Agent

Guinan Su, Yanwu Yang, Xueyan Li, et al.

强化学习

LLM

Yunho Choi, Jongwon Lim, Woojin Ahn, et al.

扩散模型

视频生成

Weiqing Xiao, Hong Li, Xiuyu Yang, et al.

LLM

Agent

Ruben Laukkonen, Seb Krier, Chloé Bakalar, et al.

多模态

多模态表征

Kechen Fang, Yihua Qin, Chongyi Wang, et al.

推理

LLM

Mohammadreza Armandpour, Fatih Ilhan, David Harrison, et al.

LLM

文本生成

Hamid Kazemi, Atoosa Chegini, Maria Safi

LLM

Transformer

Shengkun Tang, Zekun Wang, Bo Zheng, et al.

扩散模型

文本生成

Keya Hu, Linlu Qiu, Yiyang Lu, et al.

文档理解

文生图

Bihui Yu, Xinglong Xu, Junjie Jiang, et al.

LLM

模型训练

Junfeng Fang, Zhepei Hong, Mao Zheng, et al.

视频生成

视频理解

Joowon Kim, Seungho Shin, Joonhyung Park, et al.

Agent

LLM

George Wu, Nan Jing, Qing Yi, et al.

LLM

数学

Guijin Son, Seungone Kim, Catherine Arnett, et al.

多模态

通义千问

Bing Zhao, Chenfei Wu, Deqing Li, et al.

多模态

统一多模态

Junbo Cui, Bokai Xu, Chongyi Wang, et al.

强化学习

模型训练

Yi Wang, Xincheng Li, Pengwei Xie, et al.

文本生成

扩散模型

Julie Kallini, Artidoro Pagnoni, Tomasz Limisiewicz, et al.

AI for Science

数学

Daniel Zheng, Ingrid von Glehn, Yori Zwols, et al.

Agent

检索增强生成

Guankai Li, Jiabin Chen, Yi Xu, et al.

Tong Zheng, Haolin Liu, Chengsong Huang, et al.

强化学习

LLM

Yun Qu, Qi Wang, Yixiu Mao, et al.

文生图

扩散模型

Zhen Fang, Wenxuan Huang, Yu Zeng, et al.

扩散模型

视频生成

Kaixing Yang, Jiashu Zhu, Xulong Tang, et al.

检索增强生成

推理

Yilun Zhao, Jinbiao Wei, Tingyu Song, et al.

文生视频

文生图

Rui Wang, Yue Zhang, Jiehong Lin, et al.

智能问答

文本生成

Ivan Bondarenko, Roman Derunets, Oleg Sedukhin, et al.

超越推理：强化学习解锁大语言模型中的参数化知识

用于样本高效连续控制的去偏模型表示

多流大语言模型：通过并行思维、输入和输出流解锁大语言模型

你的语言模型是其自身的评论家：基于 Actor 内部状态的价值估计的强化学习

Relit-LiVE：通过联合学习环境视频实现视频重光照

积极对齐：人工智能助力人类繁荣

LLaVA-UHD v4：是什么构成了多模态大语言模型中高效的视觉编码？

揭露策略内蒸馏的真相：其有益之处、有害之处及原因分析

单个神经元足以绕过大型语言模型的安全对齐

SlimQwen：探索大型混合专家（MoE）模型预训练中的剪枝与知识蒸馏

ELF：嵌入式语言流

PaperFit：面向科学文档的视域内排版优化

基于量规的在线策略蒸馏

CollabVR：基于视觉-语言与视频生成模型的协同视频推理

TMAS：通过多智能体协同扩展测试时计算

Soohak：由数学家精心策划的基准测试，用于评估大语言模型在研究级数学能力方面的表现

Qwen-Image-2.0 技术报告

MiniCPM-o 4.5：迈向实时全双模全模态交互

部署中学习：面向通用机器人策略的车队规模强化学习

快速字节隐式Transformer

AI共同数学家：利用智能体AI加速数学研究

HyperEyes：面向并行多模态搜索代理的双粒度效率感知强化学习

均值模式尖叫：1000层扩散Transformer中的均值-方差分裂残差

LLMs改进LLMs：用于测试时缩放的Agent发现

列表策略优化：基于组的RLVR作为对LLM响应单纯形的目标投影

Flow-OPD：流匹配模型上的策略蒸馏

MACE-Dance：用于音乐驱动舞蹈视频生成的运动-外观级联专家模型

重思推理密集型检索：评估与推进智能体搜索系统中的检索器

何时信任想象力：世界动作模型的自适应动作执行

采用 Judge 协调的大模型集成框架「Meno and Friends」进行高真实性多轮响应生成

超越推理：强化学习解锁大语言模型中的参数化知识

用于样本高效连续控制的去偏模型表示

多流大语言模型：通过并行思维、输入和输出流解锁大语言模型

你的语言模型是其自身的评论家：基于 Actor 内部状态的价值估计的强化学习

Relit-LiVE：通过联合学习环境视频实现视频重光照

积极对齐：人工智能助力人类繁荣

LLaVA-UHD v4：是什么构成了多模态大语言模型中高效的视觉编码？

揭露策略内蒸馏的真相：其有益之处、有害之处及原因分析

单个神经元足以绕过大型语言模型的安全对齐

SlimQwen：探索大型混合专家（MoE）模型预训练中的剪枝与知识蒸馏

ELF：嵌入式语言流

PaperFit：面向科学文档的视域内排版优化

基于量规的在线策略蒸馏

CollabVR：基于视觉-语言与视频生成模型的协同视频推理

TMAS：通过多智能体协同扩展测试时计算

Soohak：由数学家精心策划的基准测试，用于评估大语言模型在研究级数学能力方面的表现

Qwen-Image-2.0 技术报告

MiniCPM-o 4.5：迈向实时全双模全模态交互

部署中学习：面向通用机器人策略的车队规模强化学习

快速字节隐式Transformer

AI共同数学家：利用智能体AI加速数学研究

HyperEyes：面向并行多模态搜索代理的双粒度效率感知强化学习

均值模式尖叫：1000层扩散Transformer中的均值-方差分裂残差

LLMs改进LLMs：用于测试时缩放的Agent发现

列表策略优化：基于组的RLVR作为对LLM响应单纯形的目标投影

Flow-OPD：流匹配模型上的策略蒸馏

MACE-Dance：用于音乐驱动舞蹈视频生成的运动-外观级联专家模型

重思推理密集型检索：评估与推进智能体搜索系统中的检索器

何时信任想象力：世界动作模型的自适应动作执行

采用 Judge 协调的大模型集成框架「Meno and Friends」进行高真实性多轮响应生成

Command Palette

论文

Command Palette

论文

Command Palette

论文