HyperAI
HyperAI超神经
首页
算力平台
文档
资讯
论文
教程
数据集
百科
SOTA
LLM 模型天梯
GPU 天梯
顶会
开源项目
全站搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI超神经
Toggle Sidebar
全站搜索…
⌘
K
Command Palette
Search for a command to run...
算力平台
首页
论文
论文
每日更新的前沿 AI 研究论文,助您把握人工智能最新动向
论文 | HyperAI超神经
DisCO:通过判别约束优化强化大型推理模型
Gang Li, Ming Lin, Tomer Galanti, et al.
QSVD:面向低精度视觉-语言模型中统一查询-键-值权重压缩的高效低秩近似
Yutong Wang, Haiyu Wang, Sai Qian Zhang
嵌套学习:深度学习架构的幻觉
Ali Behrouz, Meisam Razaviyayn, Peiling Zhong, et al.
SAM 3D:将图像中的任意内容3D化
SAM 3D Team, Xingyu Chen, Fu-Jen Chu, et al.
视频即答案:基于联合GRPO的下一视频事件预测与生成
Junhao Cheng, Liang Hou, Xin Tao, et al.
首帧是视频内容定制的首选之地
Jingxi Chen, Zongxia Li, Zhichao Liu, et al.
基于多模态基础模型的时空智能扩展
Zhongang Cai, Ruisi Wang, Chenyang Gu, et al.
Step-Audio-R1 技术报告
Fei Tian, Xiangyu Tony Zhang, Yuxin Zhang, et al.
V-ReasonBench:面向视频生成模型的统一推理基准测试套件
Yang Luo, Xuanlei Zhao, Baijiong Lin, et al.
Olmo 3
Allyson Ettinger, Amanda Bertsch, Bailey Kuehl, et al.
GPT-5的早期科学加速实验
Sébastien Bubeck, Christian Coester, Ronen Eldan, et al.
成为优秀的AI研究Agent需要什么?——探究创意多样性的作用
Alexis Audran-Reiss, Jordi Armengol Estapé, Karen Hambardzumyan, et al.
指令引导的胸部X光图像病灶分割方法及其自动构建的大规模数据集
Geon Choi, Hangyul Yoon, Hyunju Shin, et al.
VisPlay:从图像中自演化视觉-语言模型
Yicheng He, Chengsong Huang, Zongxia Li, et al.
通过视频进行推理:首个基于迷宫求解任务对视频模型推理能力的评估
Cheng Yang, Haiyuan Wan, Yiran Peng, et al.
VIDEOP2R:从感知到推理的视频理解
Yifan Jiang, Yueying Wang, Rui Zhao, et al.
Kandinsky 5.0:面向图像与视频生成的基础模型家族
Vladimir Arkhipkin, Vladimir Korviakov, Nikolai Gerasimenko, et al.
JAM-2:具有高成功率的类药物抗体的全计算设计
Nabla Bio
PathMind:一种基于大型语言模型的知识图谱推理的检索-优先级排序-推理框架
Yu Liu, Xixun Lin, Yanmin Shang, et al.
审稿人:超越文本反思,迈向长视频理解中的多模态内省推理
Jiaze Li, Hao Yin, Wenhui Tan, et al.
MVI-Bench:面向低视觉语言模型中误导性视觉输入鲁棒性评估的综合性基准
Huiyi Chen, Jiawei Peng, Dehai Min, et al.
世界模拟器能进行推理吗?Gen-ViRe:一个生成式视觉推理基准
Xinxin Liu, Zhaopan Xu, Kai Wang, et al.
一种风格胜过一行代码:通过离散风格空间实现代码到风格图像的生成
Huijie Liu, Shuhao Cui, Haoxiang Cao, et al.
AraLingBench:用于评估大型语言模型阿拉伯语语言能力的人工标注基准
Mohammad Zbib, Hasan Abed Al Kader Hammoud, Sina Mukalled, et al.
Think-at-Hard:通过选择性潜在迭代提升推理型语言模型
Tianyu Fu, Yichen You, Zekai Chen, et al.
HumanSense:从多模态感知到通过推理实现共情的上下文感知响应的MLLMs
Zheng Qin, Ruobing Zheng, Yabing Wang, et al.
CamCloneMaster:实现基于参考的相机控制用于视频生成
Yawen Luo, Jianhong Bai, Xiaoyu Shi, et al.
EditScore:通过高保真奖励建模解锁图像编辑中的在线RL
Xin Luo, Jiahao Wang, Chenyuan Wu, et al.
InteractMove:基于文本控制的3D场景中可移动物体的人-物交互生成
Xinhao Cai, Minghang Zheng, Xin Jin, et al.
WebCoach:具有跨会话记忆引导的自演化Web Agent
Genglin Liu, Shijie Geng, Sha Li, et al.
信任的学习:在序列决策中对不同建议者可靠性进行贝叶斯自适应
Dylan M. Asmar, Mykel J. Kochenderfer
GroupRank:一种由强化学习驱动的分组重排序范式
Duolin Sun, Meixiu Long, Dan Yang, et al.
1
2
3
4
5
35