HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

Agent世界模型：用于智能体强化学习的无限合成环境

Agent世界模型：用于智能体强化学习的无限合成环境

Zhaoyang Wang, Canwen Xu, Boyi Liu, et al.

P1-VL：连接视觉感知与物理奥赛中的科学推理

P1-VL：连接视觉感知与物理奥赛中的科学推理

多模态表征

Yun Luo, Futing Wang, Qianjia Cheng, et al.

思维链：基于自适应认知模式的推理

思维链：基于自适应认知模式的推理

Tianyi Jiang, Arctanx An, Hengyi Feng, et al.

UI-Venus-1.5 技术报告

UI-Venus-1.5 技术报告

Veuns-Team, Changlong Gao, Zhangxuan Gu, et al.

Code2World：一种通过可渲染代码生成的GUI世界模型

Code2World：一种通过可渲染代码生成的GUI世界模型

Yuhao Zheng, Li'an Zhong, Yi Wang, et al.

OPUS：面向大语言模型预训练中每轮迭代的高效且原则性数据选择

OPUS：面向大语言模型预训练中每轮迭代的高效且原则性数据选择

Shaobo Wang, Xuan Ouyang, Tianyi Xu, et al.

BagelVLA：通过交错视觉-语言-动作生成提升长时程操作能力

BagelVLA：通过交错视觉-语言-动作生成提升长时程操作能力

统一多模态

Yucheng Hu, Jianke Zhang, Yuanfei Luo, et al.

THINGS-data，一个用于研究人类大脑与行为中物体表征的多模态大规模数据集

THINGS-data，一个用于研究人类大脑与行为中物体表征的多模态大规模数据集

多模态表征

Martin N Hebart Oliver Contier, Lina Teichmann, Adam H Rockter, et al.

使用IsoDDE进行新型生物分子相互作用的精准预测

使用IsoDDE进行新型生物分子相互作用的精准预测

Isomorphic Labs Team

SkillRL：通过递归技能增强的强化学习进化Agent

SkillRL：通过递归技能增强的强化学习进化Agent

Peng Xia, Jianwen Chen, Hanyang Wang, et al.

LLaDA2.1：通过Token编辑加速文本扩散

LLaDA2.1：通过Token编辑加速文本扩散

Tiwei Bie, Maosong Cao, Xiang Cao, et al.

通过建模基于流的GRPO中的步骤级与长期采样效应缓解稀疏奖励问题

通过建模基于流的GRPO中的步骤级与长期采样效应缓解稀疏奖励问题

Yunze Tong, Mushui Liu, Canyu Zhao, et al.

循环深度视觉-语言-动作模型：通过潜在迭代推理实现视觉-语言-动作模型的隐式测试时计算扩展

循环深度视觉-语言-动作模型：通过潜在迭代推理实现视觉-语言-动作模型的隐式测试时计算扩展

Yalcin Tur, Jalal Naghiyev, Haoquan Fang, et al.

QuantaAlpha：一种面向LLM驱动的Alpha挖掘的进化框架

QuantaAlpha：一种面向LLM驱动的Alpha挖掘的进化框架

Jun Han, Shuo Zhang, Wei Li, et al.

模态间隙驱动的子空间对齐训练范式用于多模态大语言模型

模态间隙驱动的子空间对齐训练范式用于多模态大语言模型

多模态表征

Xiaomin Yu, Yi Xin, Wenjie Zhang, et al.

MOVA：迈向可扩展且同步的视频-音频生成

MOVA：迈向可扩展且同步的视频-音频生成

SII-OpenMOSS Team, Donghua Yu, Mingshu Chen, et al.

MemoryLLM：即插即用的可解释前馈记忆机制用于Transformer

MemoryLLM：即插即用的可解释前馈记忆机制用于Transformer

Ajay Jaiswal, Lauren Hannah, Han-Byul Kim, et al.

DreamDojo：基于大规模人类视频的通用机器人世界模型

DreamDojo：基于大规模人类视频的通用机器人世界模型

Shenyuan Gao, William Liang, Kaiyuan Zheng, et al.

F-GRPO：别让你的策略学习到显而易见的内容却遗忘稀有情况

F-GRPO：别让你的策略学习到显而易见的内容却遗忘稀有情况

Daniil Plyusov, Alexey Gorbatovski, Boris Shaposhnikov, et al.

MSign：通过稳定秩恢复防止大语言模型训练不稳定的优化器

MSign：通过稳定秩恢复防止大语言模型训练不稳定的优化器

Lianhai Ren, Yucheng Ding, Xiao Liu, et al.

AudioSAE：基于稀疏自编码器的音频处理模型理解

AudioSAE：基于稀疏自编码器的音频处理模型理解

音频和语音处理

Georgii Aparin, Tasnima Sadekova, Alexey Rukhovich, et al.

大型语言模型强化微调中的熵动态研究

大型语言模型强化微调中的熵动态研究

Shumin Wang, Yuexiang Xie, Wenhao Zhang, et al.

OdysseyArena：面向长时程、主动式与归纳性交互的大型语言模型基准测试

OdysseyArena：面向长时程、主动式与归纳性交互的大型语言模型基准测试

Fangzhi Xu, Hang Yan, Qiushi Sun, et al.

百川-M3：面向可靠医疗决策的临床问诊建模

百川-M3：面向可靠医疗决策的临床问诊建模

Baichuan-M3 Team, Chengfeng Dou, Fan Yang, et al.

通过漂移进行生成建模

通过漂移进行生成建模

Mingyang Deng, He Li, Tianhong Li, Kaiming He

AlphaEdit：针对语言模型的零空间约束知识编辑

AlphaEdit：针对语言模型的零空间约束知识编辑

Junfeng Fang, Houcheng Jiang, Kun Wang, et al.

在13个参数中进行推理学习

在13个参数中进行推理学习

John X. Morris, Niloofar Mireshghallah, Mark Ibrahim, et al.

DFlash：用于快速推测解码的块扩散方法

DFlash：用于快速推测解码的块扩散方法

Jian Chen, Yesheng Liang, Zhijian Liu

上下文强制：基于长上下文的一致性自回归视频生成

上下文强制：基于长上下文的一致性自回归视频生成

Shuo Chen, Cong Wei, Sun Sun, et al.

MemSkill：面向自演化智能体的内存技能学习与演化

MemSkill：面向自演化智能体的内存技能学习与演化

Haozhen Zhang, Quanyu Long, Jianzhu Bao, et al.

长度无偏序列策略优化：揭示与控制RLVR中的响应长度变异

长度无偏序列策略优化：揭示与控制RLVR中的响应长度变异

Fanfan Liu, Youyang Yin, Peng Shi, et al.

蜘蛛感：基于分层自适应筛选的高效Agent防御内在风险感知

蜘蛛感：基于分层自适应筛选的高效Agent防御内在风险感知

Zhenxiong Yu, Zhi Yang, Zhiheng Jin, et al.

Agent世界模型：用于智能体强化学习的无限合成环境

Agent世界模型：用于智能体强化学习的无限合成环境

Zhaoyang Wang, Canwen Xu, Boyi Liu, et al.

P1-VL：连接视觉感知与物理奥赛中的科学推理

P1-VL：连接视觉感知与物理奥赛中的科学推理

多模态表征

Yun Luo, Futing Wang, Qianjia Cheng, et al.

思维链：基于自适应认知模式的推理

思维链：基于自适应认知模式的推理

Tianyi Jiang, Arctanx An, Hengyi Feng, et al.

UI-Venus-1.5 技术报告

UI-Venus-1.5 技术报告

Veuns-Team, Changlong Gao, Zhangxuan Gu, et al.

Code2World：一种通过可渲染代码生成的GUI世界模型

Code2World：一种通过可渲染代码生成的GUI世界模型

Yuhao Zheng, Li'an Zhong, Yi Wang, et al.

OPUS：面向大语言模型预训练中每轮迭代的高效且原则性数据选择

OPUS：面向大语言模型预训练中每轮迭代的高效且原则性数据选择

Shaobo Wang, Xuan Ouyang, Tianyi Xu, et al.

BagelVLA：通过交错视觉-语言-动作生成提升长时程操作能力

BagelVLA：通过交错视觉-语言-动作生成提升长时程操作能力

统一多模态

Yucheng Hu, Jianke Zhang, Yuanfei Luo, et al.

THINGS-data，一个用于研究人类大脑与行为中物体表征的多模态大规模数据集

THINGS-data，一个用于研究人类大脑与行为中物体表征的多模态大规模数据集

多模态表征

Martin N Hebart Oliver Contier, Lina Teichmann, Adam H Rockter, et al.

使用IsoDDE进行新型生物分子相互作用的精准预测

使用IsoDDE进行新型生物分子相互作用的精准预测

Isomorphic Labs Team

SkillRL：通过递归技能增强的强化学习进化Agent

SkillRL：通过递归技能增强的强化学习进化Agent

Peng Xia, Jianwen Chen, Hanyang Wang, et al.

LLaDA2.1：通过Token编辑加速文本扩散

LLaDA2.1：通过Token编辑加速文本扩散

Tiwei Bie, Maosong Cao, Xiang Cao, et al.

通过建模基于流的GRPO中的步骤级与长期采样效应缓解稀疏奖励问题

通过建模基于流的GRPO中的步骤级与长期采样效应缓解稀疏奖励问题

Yunze Tong, Mushui Liu, Canyu Zhao, et al.

循环深度视觉-语言-动作模型：通过潜在迭代推理实现视觉-语言-动作模型的隐式测试时计算扩展

循环深度视觉-语言-动作模型：通过潜在迭代推理实现视觉-语言-动作模型的隐式测试时计算扩展

Yalcin Tur, Jalal Naghiyev, Haoquan Fang, et al.

QuantaAlpha：一种面向LLM驱动的Alpha挖掘的进化框架

QuantaAlpha：一种面向LLM驱动的Alpha挖掘的进化框架

Jun Han, Shuo Zhang, Wei Li, et al.

模态间隙驱动的子空间对齐训练范式用于多模态大语言模型

模态间隙驱动的子空间对齐训练范式用于多模态大语言模型

多模态表征

Xiaomin Yu, Yi Xin, Wenjie Zhang, et al.

MOVA：迈向可扩展且同步的视频-音频生成

MOVA：迈向可扩展且同步的视频-音频生成

SII-OpenMOSS Team, Donghua Yu, Mingshu Chen, et al.

MemoryLLM：即插即用的可解释前馈记忆机制用于Transformer

MemoryLLM：即插即用的可解释前馈记忆机制用于Transformer

Ajay Jaiswal, Lauren Hannah, Han-Byul Kim, et al.

DreamDojo：基于大规模人类视频的通用机器人世界模型

DreamDojo：基于大规模人类视频的通用机器人世界模型

Shenyuan Gao, William Liang, Kaiyuan Zheng, et al.

F-GRPO：别让你的策略学习到显而易见的内容却遗忘稀有情况

F-GRPO：别让你的策略学习到显而易见的内容却遗忘稀有情况

Daniil Plyusov, Alexey Gorbatovski, Boris Shaposhnikov, et al.

MSign：通过稳定秩恢复防止大语言模型训练不稳定的优化器

MSign：通过稳定秩恢复防止大语言模型训练不稳定的优化器

Lianhai Ren, Yucheng Ding, Xiao Liu, et al.

AudioSAE：基于稀疏自编码器的音频处理模型理解

AudioSAE：基于稀疏自编码器的音频处理模型理解

音频和语音处理

Georgii Aparin, Tasnima Sadekova, Alexey Rukhovich, et al.

大型语言模型强化微调中的熵动态研究

大型语言模型强化微调中的熵动态研究

Shumin Wang, Yuexiang Xie, Wenhao Zhang, et al.

OdysseyArena：面向长时程、主动式与归纳性交互的大型语言模型基准测试

OdysseyArena：面向长时程、主动式与归纳性交互的大型语言模型基准测试

Fangzhi Xu, Hang Yan, Qiushi Sun, et al.

百川-M3：面向可靠医疗决策的临床问诊建模

百川-M3：面向可靠医疗决策的临床问诊建模

Baichuan-M3 Team, Chengfeng Dou, Fan Yang, et al.

通过漂移进行生成建模

通过漂移进行生成建模

Mingyang Deng, He Li, Tianhong Li, Kaiming He

AlphaEdit：针对语言模型的零空间约束知识编辑

AlphaEdit：针对语言模型的零空间约束知识编辑

Junfeng Fang, Houcheng Jiang, Kun Wang, et al.

在13个参数中进行推理学习

在13个参数中进行推理学习

John X. Morris, Niloofar Mireshghallah, Mark Ibrahim, et al.

DFlash：用于快速推测解码的块扩散方法

DFlash：用于快速推测解码的块扩散方法

Jian Chen, Yesheng Liang, Zhijian Liu

上下文强制：基于长上下文的一致性自回归视频生成

上下文强制：基于长上下文的一致性自回归视频生成

Shuo Chen, Cong Wei, Sun Sun, et al.

MemSkill：面向自演化智能体的内存技能学习与演化

MemSkill：面向自演化智能体的内存技能学习与演化

Haozhen Zhang, Quanyu Long, Jianzhu Bao, et al.

长度无偏序列策略优化：揭示与控制RLVR中的响应长度变异

长度无偏序列策略优化：揭示与控制RLVR中的响应长度变异

Fanfan Liu, Youyang Yin, Peng Shi, et al.

蜘蛛感：基于分层自适应筛选的高效Agent防御内在风险感知

蜘蛛感：基于分层自适应筛选的高效Agent防御内在风险感知

Zhenxiong Yu, Zhi Yang, Zhiheng Jin, et al.