HyperAI
HyperAI超神经
首页
算力平台
文档
资讯
论文
教程
数据集
百科
SOTA
LLM 模型天梯
GPU 天梯
顶会
开源项目
全站搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI超神经
Toggle Sidebar
全站搜索…
⌘
K
Command Palette
Search for a command to run...
算力平台
首页
论文
论文
每日更新的前沿 AI 研究论文,助您把握人工智能最新动向
论文 | HyperAI超神经
组合式创造力:泛化能力的新前沿
Samuel Schapiro, Sumuk Shashidhar, Alexi Gladstone, et al.
因果时空预测:一种高效且有效的多模态方法
Yuting Huang, Ziquan Fang, Zhihao Zeng, et al.
Hunyuan3D-Omni:一种用于可控生成3D资产的统一框架
Team Hunyuan3D, Bowen Zhang, Chunchao Guo, et al.
Seedream 4.0:迈向下一代多模态图像生成
Team Seedream, Yunpeng Chen, Yu Gao, et al.
LLM Agent强化学习中的树搜索
Yuxiang Ji, Ziyu Ma, Yong Wang, et al.
SciReasoner:跨学科奠定科学推理基础
Yizhou Wang, Chen Tang, Han Deng, et al.
MMR1:通过方差感知采样与开放资源增强多模态推理
Sicong Leng, Jing Wang, Jiaxi Li, et al.
基于方差的课程强化学习用于大语言模型
Guochao Jiang, Wenfeng Feng, Guofeng Quan, et al.
MultiEdit:在多样且具有挑战性的任务上推进基于指令的图像编辑
Mingsong Li, Lin Liu, Hongjun Wang, et al.
BRISC:基于Swin-HAFNet的脑肿瘤分割与分类标注数据集
Amirreza Fateh, Yasin Rezvani, Sara Moayedi, et al.
FDABench:面向异构数据上分析查询的数据Agent基准测试
Ziting Wang, Shize Zhang, Haitao Yuan, et al.
作画易,思辨难:文本到图像模型能否铺就舞台,却无法主导演出?
Ouxiang Li, Yuan Wang, Xinting Hu, et al.
UniVerse-1:通过专家拼接实现统一的音视频生成
Duomin Wang, Wei Zuo, Aojie Li, et al.
基础模型在逐步具身推理中的表现如何?
Dinura Dissanayake, Ahmed Heakl, Omkar Thawakar, et al.
脉冲脑技术报告:脉冲脑启发的大规模模型
Yuqi Pan, Yupeng Feng, Jinghao Zhuang, et al.
SAGE:语义理解的现实基准
Samarth Goel, Reagan J. Lee, Kannan Ramchandran
WAVECLIP:小波Token化用于自适应分辨率CLIP
Moshe Kimhi, Erez Koifman, Ehud Rivlin, et al.
EmbeddingGemma:强大且轻量的文本表示
Henrique Schechter Vera, Sahil Dua, Biao Zhang, et al.
通过GRPO提升语音感知语言模型中的语音理解能力
Avishai Elmakies, Hagai Aronowitz, Nimrod Shabtay, et al.
VLMs 距离视觉空间智能还有多远?一项基准驱动的视角
Songsong Yu, Yuxin Chen, Hao Ju, et al.
SIM-CoT:监督式隐式思维链
Xilin Wei, Xiaoran Liu, Yuhang Zang, et al.
SWE-QA:语言模型能否回答仓库级代码问题?
Weihan Peng, Yuling Shi, Yuhang Wang, et al.
视频模型是零样本学习者和推理者
Thaddäus Wiedemer, Yuxuan Li, Paul Vicol, et al.
用于机械工程分析问题关键求解的N-Plus-1 GPT Agent
Anthony Patera, Rohan Abeyaratne
Memory-QA:基于多模态记忆的回忆问答
Hongda Jiang, Xinyuan Zhang, Siddhant Garg, et al.
MAPO:混合优势策略优化
Wenke Huang, Quan Zhang, Yiyang Fang, et al.
Hyper-Bagel:一种用于多模态理解与生成的统一加速框架
Yanzuo Lu, Xin Xia, Manlin Zhang, et al.
预训练数据上的强化学习
Siheng Li, Kejiao Li, Zenan Xu, et al.
视觉运动策略中是否需要本体感觉状态?
Juntu Zhao, Wenbo Lu, Di Zhang, et al.
Baseer:用于阿拉伯文文档到Markdown OCR的视觉-语言模型
Khalil Hennara, Muhammad Hreden, Mohamed Motasim Hamed, et al.
GenExam:跨学科文本到图像测评
Zhaokai Wang, Penghao Yin, Xiangyu Zhao, et al.
Nav-R1:具身场景中的推理与导航
Qingxiang Liu, Ting Huang, Zeyu Zhang, et al.
1
10
11
12
13
14
15
16
35