HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务协议
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务协议
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
pi0.7:一种具有涌现能力的、可控的通用机器人 Foundation Model
多模态
多模态表征
Bo Ai, Ali Amin, Raichelle Aniceto, et al.
GTR:引导式思维强化通过防止 RL 基础的 VLM Agent 训练中的思维崩溃(Thought Collapse)来提升性能
强化学习
Agent
Tong Wei, Yijun Yang, Junliang Xing, et al.
Large Language Models 的 Agent Skills:架构、获取、安全与未来路径
Agent
LLM
Ranjun Xu, Yang Yan
空间理论:Foundation Models 能否通过主动探索构建空间信念?
具身智能
Agent
Pingyue Zhang, Zihan Huang, Yue Wang, et al.
记忆迁移学习:Memory 在 Coding Agents 中是如何跨领域迁移的
Agent
代码生成
Kangsan Kim, Minki Kang, Taeil Kim, et al.
OccuBench: 通过 Language World Models 在真实世界专业任务上评估 AI Agents
基准
Agent
Xiaomeng Hu, Yinger Zhang, Fei Huang, et al.
SpatialEvo:通过确定性几何环境实现自我演化的空间智能
机器视觉 3D
视觉问答
Dinging Li, Yingxiu Zhao, Xinrui Cheng, et al.
RationalRewards:通过推理 Rewards 在训练与测试阶段共同提升视觉生成的 Scale
文生图
图像生成
Haozhe Wang, Cong Wei, Weiming Ren, et al.
Seedance 2.0:提升应对世界复杂性的 Video Generation 能力
视频生成
多模态
Team Seedance, De Chen, Liyang Chen, et al.
GameWorld:迈向多模态 Game Agents 标准化与可验证性的评估研究
Agent
基准
Mingyu Ouyang, Siyuan Hu, Kevin Qinghong Lin, et al.
通过 ScaleFormer 实现跨尺度 Pansharpening 以及 PanScale 基准测试
图像生成
Ke Cao, Xuanhua He, Xueheng Li, et al.
ParseBench:面向 AI Agents 的文档解析基准测试
文档理解
基准
Boyang Zhang, Sebastián G. Acosta, Preston Carlson, et al.
存储智能 Agent
Agent
LLM
Jingyang Qiao, Weicheng Meng, Yu Cheng, et al.
PROPELLA-1:面向大规模 LLM 数据策展的多属性文档标注
LLM
模型训练
Maximilian Idahl, Benedikt Droste, Björn Plüster, et al.
长上下文视觉文档理解中的内化推理机制
文档理解
视觉问答
Austin Veselka
TurboQuant:具有近乎最优失真率的在线 Vector Quantization 方法
Amir Zandieh, Majid Daliri, Majid Hadian, et al.
BERT-as-a-Judge:一种高效、稳健的参考式大语言模型评估方法,可替代传统词汇法
LLM
文本生成
Hippolyte Gisserot-Boukhlef, Nicolas Boizard, Emmanuel Malherbe, et al.
SPPO:用于长程推理任务的序列级PPO方法
强化学习
LLM
Tianyi Wang, Yixia Li, Long Li, et al.
屏幕上的图灵测试:移动端GUI智能体人性化评测基准
Agent
多模态
Jiachen Zhu, Lingyu Yang, Rong Shan, et al.
Audio-Omni: 将多模态理解扩展至多功能的 Audio 生成与编辑
音频生成
统一多模态
Zeyue Tian, Binxin Yang, Zhaoyang Liu, et al.
重新思考大语言模型的在线策略蒸馏:现象、机制与方法配方
模型训练
LLM
Yaxuan Li, Yuxin Zuo, Bingxiang He, et al.
KnowRL: 通过最小充分知识引导的强化学习提升大语言模型推理能力
强化学习
LLM
Linhao Yu, Tianmeng Yang, Siyu Ding, et al.
Uni-ViGU:基于扩散式视频生成器的统一视频生成与理解方法
视频生成
视频理解
Luozheng Qin, Jia Gong, Qian Qiao, et al.
ClawGUI:用于训练、评测与部署GUI智能体的统一框架
Agent
多模态
Fei Tang, Zhiqiong Lu, Boxuan Zhang, et al.
Transformers 中的 Attention Sink:关于其利用、解释与缓解的研究综述
Transformer
深度学习
Zunhai Su, Hengyuan Zhang, Wei Wu, et al.
OmniShow: 统一用于 Human-Object Interaction 视频生成的 Multimodal Conditions
视频生成
多模态
Donghao Zhou, Guisheng Liu, Hao Yang, et al.
往事并非过往:基于 Memory 增强的 Dynamic Reward Shaping
强化学习
LLM
Yang Liu, Enxi Wang, Yufei Gao, et al.
QuanBench+: 一个用于 LLM-Based 量子代码生成的统一多框架 benchmark
代码生成
LLM
Ali Slim, Haydar Hamieh, Jawad Kotaich, et al.
用于视觉生成的 Elastic Looped Transformers
A. Pokle, K. Liang, J. Treutlein, et al.
ECHO: 基于 One-step Block Diffusion 的高效胸部 X 线报告生成
扩散模型
文本生成
Lifeng Chen, Tianqi You, Hao Liu, et al.
Matrix-Game 3.0:具有长时程 Memory 的实时流式交互式 World Model
Zile Wang, Zexiang Liu, Jaixing Li, et al.
EXAONE 4.5 技术报告
多模态
LLM
Eunbi Choi, Kibong Choi, Sehyun Chun, et al.
1
2
3
4
60
pi0.7:一种具有涌现能力的、可控的通用机器人 Foundation Model
多模态
多模态表征
Bo Ai, Ali Amin, Raichelle Aniceto, et al.
GTR:引导式思维强化通过防止 RL 基础的 VLM Agent 训练中的思维崩溃(Thought Collapse)来提升性能
强化学习
Agent
Tong Wei, Yijun Yang, Junliang Xing, et al.
Large Language Models 的 Agent Skills:架构、获取、安全与未来路径
Agent
LLM
Ranjun Xu, Yang Yan
空间理论:Foundation Models 能否通过主动探索构建空间信念?
具身智能
Agent
Pingyue Zhang, Zihan Huang, Yue Wang, et al.
记忆迁移学习:Memory 在 Coding Agents 中是如何跨领域迁移的
Agent
代码生成
Kangsan Kim, Minki Kang, Taeil Kim, et al.
OccuBench: 通过 Language World Models 在真实世界专业任务上评估 AI Agents
基准
Agent
Xiaomeng Hu, Yinger Zhang, Fei Huang, et al.
SpatialEvo:通过确定性几何环境实现自我演化的空间智能
机器视觉 3D
视觉问答
Dinging Li, Yingxiu Zhao, Xinrui Cheng, et al.
RationalRewards:通过推理 Rewards 在训练与测试阶段共同提升视觉生成的 Scale
文生图
图像生成
Haozhe Wang, Cong Wei, Weiming Ren, et al.
Seedance 2.0:提升应对世界复杂性的 Video Generation 能力
视频生成
多模态
Team Seedance, De Chen, Liyang Chen, et al.
GameWorld:迈向多模态 Game Agents 标准化与可验证性的评估研究
Agent
基准
Mingyu Ouyang, Siyuan Hu, Kevin Qinghong Lin, et al.
通过 ScaleFormer 实现跨尺度 Pansharpening 以及 PanScale 基准测试
图像生成
Ke Cao, Xuanhua He, Xueheng Li, et al.
ParseBench:面向 AI Agents 的文档解析基准测试
文档理解
基准
Boyang Zhang, Sebastián G. Acosta, Preston Carlson, et al.
存储智能 Agent
Agent
LLM
Jingyang Qiao, Weicheng Meng, Yu Cheng, et al.
PROPELLA-1:面向大规模 LLM 数据策展的多属性文档标注
LLM
模型训练
Maximilian Idahl, Benedikt Droste, Björn Plüster, et al.
长上下文视觉文档理解中的内化推理机制
文档理解
视觉问答
Austin Veselka
TurboQuant:具有近乎最优失真率的在线 Vector Quantization 方法
Amir Zandieh, Majid Daliri, Majid Hadian, et al.
BERT-as-a-Judge:一种高效、稳健的参考式大语言模型评估方法,可替代传统词汇法
LLM
文本生成
Hippolyte Gisserot-Boukhlef, Nicolas Boizard, Emmanuel Malherbe, et al.
SPPO:用于长程推理任务的序列级PPO方法
强化学习
LLM
Tianyi Wang, Yixia Li, Long Li, et al.
屏幕上的图灵测试:移动端GUI智能体人性化评测基准
Agent
多模态
Jiachen Zhu, Lingyu Yang, Rong Shan, et al.
Audio-Omni: 将多模态理解扩展至多功能的 Audio 生成与编辑
音频生成
统一多模态
Zeyue Tian, Binxin Yang, Zhaoyang Liu, et al.
重新思考大语言模型的在线策略蒸馏:现象、机制与方法配方
模型训练
LLM
Yaxuan Li, Yuxin Zuo, Bingxiang He, et al.
KnowRL: 通过最小充分知识引导的强化学习提升大语言模型推理能力
强化学习
LLM
Linhao Yu, Tianmeng Yang, Siyu Ding, et al.
Uni-ViGU:基于扩散式视频生成器的统一视频生成与理解方法
视频生成
视频理解
Luozheng Qin, Jia Gong, Qian Qiao, et al.
ClawGUI:用于训练、评测与部署GUI智能体的统一框架
Agent
多模态
Fei Tang, Zhiqiong Lu, Boxuan Zhang, et al.
Transformers 中的 Attention Sink:关于其利用、解释与缓解的研究综述
Transformer
深度学习
Zunhai Su, Hengyuan Zhang, Wei Wu, et al.
OmniShow: 统一用于 Human-Object Interaction 视频生成的 Multimodal Conditions
视频生成
多模态
Donghao Zhou, Guisheng Liu, Hao Yang, et al.
往事并非过往:基于 Memory 增强的 Dynamic Reward Shaping
强化学习
LLM
Yang Liu, Enxi Wang, Yufei Gao, et al.
QuanBench+: 一个用于 LLM-Based 量子代码生成的统一多框架 benchmark
代码生成
LLM
Ali Slim, Haydar Hamieh, Jawad Kotaich, et al.
用于视觉生成的 Elastic Looped Transformers
A. Pokle, K. Liang, J. Treutlein, et al.
ECHO: 基于 One-step Block Diffusion 的高效胸部 X 线报告生成
扩散模型
文本生成
Lifeng Chen, Tianqi You, Hao Liu, et al.
Matrix-Game 3.0:具有长时程 Memory 的实时流式交互式 World Model
Zile Wang, Zexiang Liu, Jaixing Li, et al.
EXAONE 4.5 技术报告
多模态
LLM
Eunbi Choi, Kibong Choi, Sehyun Chun, et al.
1
2
3
4
60