HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
Brain-IT:通过Brain-Interaction Transformer从fMRI进行图像重建
多模态
计算机视觉
Roman Beliy, Amit Zalcher, Jonathan Kogman, et al.
模态冲突时:单模态推理不确定性如何主导MLLMs中的偏好动态
视觉问答
推理
Zhuoran Zhang, Tengyue Wang, Xilin Gong, et al.
不要盲视你的VLA:面向OOD泛化的视觉表征对齐
多模态
多模态表征
Nikita Kachaev, Mikhail Kolosov, Daniil Zelezetsky, et al.
当可视化成为推理的第一步时:MIRA,一个用于视觉链式思维的基准测试
多模态
推理
Yiyang Zhou, Haoqin Tu, Zijun Wang, et al.
VCode:一个以SVG作为符号化视觉表示的多模态编码基准
代码生成
多模态
Kevin Qinghong Lin, Yuhao Zheng, Hangyu Ran, et al.
人工智能生产力指数(APEX)
基准
LLM
Bertie Vidgen, Abby Fennelly, Evan Pinnix, et al.
帧链:通过帧感知推理推进多模态LLM中的视频理解
视频理解
视觉问答
Sara Ghazanfari, Francesco Croce, Nicolas Flammarion, et al.
面向鲁棒的数学推理
基准
推理
Thang Luong, Dawsen Hwang, Hoang H. Nguyen, et al.
面向未来基于空间的、高度可扩展的人工智能基础设施系统设计
高性能计算
AI for Science
Blaise Agüera y Arcas, Travis Beals, Maria Biggs, et al.
PHUMA:物理基础的人形行走数据集
数据集
机器人技术
Kyungmin Lee, Sibeen Kim, Minho Park, et al.
UniREditBench:一个统一的基于推理的图像编辑基准
基准
图生图
Feng Han, Yibin Wang, Chenglin Li, et al.
将测试时计算最优缩放泛化为可优化图
LLM
算法
Fali Wang, Jihai Chen, Shuhua Yang, et al.
UniLumos:基于物理合理反馈的快速统一图像与视频重光照
扩散模型
深度估计
Ropeway Liu, Hangjie Yuan, Bo Dong, et al.
视觉模型在图结构理解中的被低估的力量
计算机视觉
Transformer
Xinjian Zhao, Wei Pang, Zhongkai Xue, et al.
每一次激活都更进一步:将通用推理器扩展至1万亿开放语言基础
推理
Transformer
Ling-Team, Ang Li, Ben Liu, et al.
NOBLE - 具有生物启发的潜在嵌入的神经算子,用于捕捉生物神经元模型中的实验变异性
深度学习
建模
Luca Ghafourpour, Valentin Duruisseaux, Bahareh Tolooshams, et al.
胶质细胞:一种受人类启发的用于自动化系统设计与优化的AI
DeepSeek
推理
Pouya Hamadanian, Pantea Karimi, Arash Nasr-Esfahany, et al.
上下文工程2.0:上下文工程的上下文
Agent
人工智能
Qishuo Hua, Lyumanshan Ye, Dayuan Fu, et al.
空间-SSRL:通过自监督强化学习增强空间理解
图像理解
计算机视觉
Yuhong Liu, Beichen Zhang, Yuhang Zang, et al.
连续自回归语言模型
LLM
文本生成
Chenze Shao, Darren Li, Fandong Meng, et al.
π𝚁𝙻:基于流的视觉-语言-动作模型的在线RL微调
强化学习
监督式微调
Kang Chen, Zhihao Liu, Tonghe Zhang, et al.
INT 与 FP:细粒度低比特量化格式的综合研究
LLM
Transformer
Mengzhao Chen, Meng Wu, Hui Jin, et al.
ThinkMorph:多模态交错思维链推理中的涌现特性
多模态
推理
Jiawei Gu, Yunzhuo Hao, Huichen Will Wang, et al.
OS-Sentinel:通过在真实工作流中混合验证实现安全增强的移动GUI Agent
Agent
安防
Qiushi Sun, Mukai Li, Zhoumianze Liu, et al.
代理型组织时代:与语言模型共同学习组织之道
Agent
LLM
Zewen Chi, Li Dong, Qingxiu Dong, et al.
SPICE:在语料库环境中进行自对弈提升推理能力
强化学习
LLM
Bo Liu, Chuanyang Jin, Seungone Kim, et al.
Surfer 2:下一代跨平台计算机使用Agent
Agent
人机交互
Mathieu Andreux, Märt Bakler, Yanael Barbier, et al.
扩散模型在机器人控制中的应用条件探索
扩散模型
机器人技术
Heeseong Shin, Byeongho Heo, Dongyoon Han, et al.
Agent 能否征服网络?探索 ChatGPT Atlas Agent 在网络游戏中的前沿应用
Agent
LLM
Jingran Zhang, Ning Li, Justin Cui
Kimi Linear:一种表达性强、高效的Attention架构
Transformer
LLM
Kimi Team, Yu Zhang, Zongyu Lin, et al.
Emu3.5:原生多模态模型是世界学习者
统一多模态
LLM
Yufeng Cui, Honghao Chen, Haoge Deng, et al.
手动解码的终结:迈向真正端到端的语言模型
LLM
Transformer
Zhichao Wang, Dongyang Ma, Xinting Huang, et al.
1
18
19
20
21
22
23
24
50
Brain-IT:通过Brain-Interaction Transformer从fMRI进行图像重建
多模态
计算机视觉
Roman Beliy, Amit Zalcher, Jonathan Kogman, et al.
模态冲突时:单模态推理不确定性如何主导MLLMs中的偏好动态
视觉问答
推理
Zhuoran Zhang, Tengyue Wang, Xilin Gong, et al.
不要盲视你的VLA:面向OOD泛化的视觉表征对齐
多模态
多模态表征
Nikita Kachaev, Mikhail Kolosov, Daniil Zelezetsky, et al.
当可视化成为推理的第一步时:MIRA,一个用于视觉链式思维的基准测试
多模态
推理
Yiyang Zhou, Haoqin Tu, Zijun Wang, et al.
VCode:一个以SVG作为符号化视觉表示的多模态编码基准
代码生成
多模态
Kevin Qinghong Lin, Yuhao Zheng, Hangyu Ran, et al.
人工智能生产力指数(APEX)
基准
LLM
Bertie Vidgen, Abby Fennelly, Evan Pinnix, et al.
帧链:通过帧感知推理推进多模态LLM中的视频理解
视频理解
视觉问答
Sara Ghazanfari, Francesco Croce, Nicolas Flammarion, et al.
面向鲁棒的数学推理
基准
推理
Thang Luong, Dawsen Hwang, Hoang H. Nguyen, et al.
面向未来基于空间的、高度可扩展的人工智能基础设施系统设计
高性能计算
AI for Science
Blaise Agüera y Arcas, Travis Beals, Maria Biggs, et al.
PHUMA:物理基础的人形行走数据集
数据集
机器人技术
Kyungmin Lee, Sibeen Kim, Minho Park, et al.
UniREditBench:一个统一的基于推理的图像编辑基准
基准
图生图
Feng Han, Yibin Wang, Chenglin Li, et al.
将测试时计算最优缩放泛化为可优化图
LLM
算法
Fali Wang, Jihai Chen, Shuhua Yang, et al.
UniLumos:基于物理合理反馈的快速统一图像与视频重光照
扩散模型
深度估计
Ropeway Liu, Hangjie Yuan, Bo Dong, et al.
视觉模型在图结构理解中的被低估的力量
计算机视觉
Transformer
Xinjian Zhao, Wei Pang, Zhongkai Xue, et al.
每一次激活都更进一步:将通用推理器扩展至1万亿开放语言基础
推理
Transformer
Ling-Team, Ang Li, Ben Liu, et al.
NOBLE - 具有生物启发的潜在嵌入的神经算子,用于捕捉生物神经元模型中的实验变异性
深度学习
建模
Luca Ghafourpour, Valentin Duruisseaux, Bahareh Tolooshams, et al.
胶质细胞:一种受人类启发的用于自动化系统设计与优化的AI
DeepSeek
推理
Pouya Hamadanian, Pantea Karimi, Arash Nasr-Esfahany, et al.
上下文工程2.0:上下文工程的上下文
Agent
人工智能
Qishuo Hua, Lyumanshan Ye, Dayuan Fu, et al.
空间-SSRL:通过自监督强化学习增强空间理解
图像理解
计算机视觉
Yuhong Liu, Beichen Zhang, Yuhang Zang, et al.
连续自回归语言模型
LLM
文本生成
Chenze Shao, Darren Li, Fandong Meng, et al.
π𝚁𝙻:基于流的视觉-语言-动作模型的在线RL微调
强化学习
监督式微调
Kang Chen, Zhihao Liu, Tonghe Zhang, et al.
INT 与 FP:细粒度低比特量化格式的综合研究
LLM
Transformer
Mengzhao Chen, Meng Wu, Hui Jin, et al.
ThinkMorph:多模态交错思维链推理中的涌现特性
多模态
推理
Jiawei Gu, Yunzhuo Hao, Huichen Will Wang, et al.
OS-Sentinel:通过在真实工作流中混合验证实现安全增强的移动GUI Agent
Agent
安防
Qiushi Sun, Mukai Li, Zhoumianze Liu, et al.
代理型组织时代:与语言模型共同学习组织之道
Agent
LLM
Zewen Chi, Li Dong, Qingxiu Dong, et al.
SPICE:在语料库环境中进行自对弈提升推理能力
强化学习
LLM
Bo Liu, Chuanyang Jin, Seungone Kim, et al.
Surfer 2:下一代跨平台计算机使用Agent
Agent
人机交互
Mathieu Andreux, Märt Bakler, Yanael Barbier, et al.
扩散模型在机器人控制中的应用条件探索
扩散模型
机器人技术
Heeseong Shin, Byeongho Heo, Dongyoon Han, et al.
Agent 能否征服网络?探索 ChatGPT Atlas Agent 在网络游戏中的前沿应用
Agent
LLM
Jingran Zhang, Ning Li, Justin Cui
Kimi Linear:一种表达性强、高效的Attention架构
Transformer
LLM
Kimi Team, Yu Zhang, Zongyu Lin, et al.
Emu3.5:原生多模态模型是世界学习者
统一多模态
LLM
Yufeng Cui, Honghao Chen, Haoge Deng, et al.
手动解码的终结:迈向真正端到端的语言模型
LLM
Transformer
Zhichao Wang, Dongyang Ma, Xinting Huang, et al.
1
18
19
20
21
22
23
24
50