HyperAI
HyperAI超神经
首页
算力平台
文档
资讯
论文
教程
数据集
百科
SOTA
LLM 模型天梯
GPU 天梯
顶会
开源项目
全站搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI超神经
Toggle Sidebar
全站搜索…
⌘
K
Command Palette
Search for a command to run...
算力平台
首页
论文
论文
每日更新的前沿 AI 研究论文,助您把握人工智能最新动向
论文 | HyperAI超神经
CTRL-Rec:通过自然语言控制推荐系统
Micah Carroll, Adeline Foote, Kevin Feng, et al.
RLFR:通过流环境扩展用于LLM的强化学习
Jinghao Zhang, Naishan Zheng, Ruilin Li, et al.
潜在精炼解码:通过精炼信念状态增强基于扩散的LLM
Qinglin Zhu, Yizhen Yao, Runcong Zhao, et al.
OmniVideoBench:面向全景多模态大模型的音视频理解评估
Caorui Li, Yu Chen, Yiyan Ji, et al.
BEAR:面向原子化具身能力的多模态语言模型基准测试与增强
Yu Qi, Haibo Zhao, Ziyu Guo, et al.
具有表示自编码器的扩散Transformer
Boyang Zheng, Nanye Ma, Shengbang Tong, et al.
QeRL:超越效率——面向LLMs的量化增强型强化学习
Wei Huang, Yi Ge, Shuai Yang, et al.
无需反向传播的威尔逊环:一种用于检测不变性与顺序敏感性的实用诊断方法
Edward Y. Chang, Ethan Y. Chang
TUMIX:带有工具使用混合的多Agent测试时扩展
Yongchao Chen, Jiefeng Chen, Rui Meng, et al.
R-Horizon:你的大型推理模型在广度与深度上究竟能走多远?
Yi Lu, Jianing Wang, Linsen Guo, et al.
AutoPR:让我们自动化你的学术晋升!
Qiguang Chen, Zheng Yan, Mingda Yang, et al.
多模态提示优化:为何不利用多种模态来提升MLLMs?
Yumin Choi, Dongki Kim, Jinheon Baek, et al.
旁路增强引导用于幻觉抑制的扩散采样
Hyunmin Cho, Donghoon Ahn, Susung Hong, et al.
用相机思考:一种面向以相机为中心的感知与生成的统一多模态模型
Kang Liao, Size Wu, Zhonghua Wu, et al.
D2E:在桌面数据上扩展视觉-动作预训练以实现向具身AI的迁移
Suwhan Choi, Jaeyoon Jung, Haebin Seong, et al.
Code2Video:一种以代码为中心的教育视频生成范式
Yanzhe Chen, Kevin Qinghong Lin, Mike Zheng Shou
博士偏见:人工智能驱动的医疗指导中的社会不平等
Emma Kondrup, Anne Imouza
LLM的二阶优化潜力:基于完整高斯-牛顿法的研究
Natalie Abreu, Nikhil Vyas, Sham Kakade, et al.
元认知增强推理模型:自对齐强化学习
Yoonjeon Kim, Doohyuk Jang, Eunho Yang
从何到因:一种基于证据的化学反应条件推理多Agent系统
Cheng Yang, Jiaxuan Lu, Haiyuan Wan, et al.
DreamOmni2:基于多模态指令的编辑与生成
Bin Xia, Bohao Peng, Yuechen Zhang, et al.
VideoCanvas:通过上下文条件实现任意时空补丁的统一视频补全
Minghong Cai, Qiulin Wang, Zongli Ye, et al.
UniVideo:视频的统一理解、生成与编辑
Cong Wei, Quande Liu, Zixuan Ye, et al.
MemMamba:重新思考状态空间模型中的记忆模式
Youjin Wang, Yangjingyi Chen, Jiahao Yan, et al.
MM-HELIX:通过整体平台与自适应混合策略优化提升多模态长链反思推理
Xiangyu Zhao, Junming Lin, Tianhao Liang, et al.
PromptCoT 2.0:面向大型语言模型推理的提示合成扩展
Xueliang Zhao, Wei Wu, Jian Guan, et al.
Extract-0:用于文档信息提取的专用语言模型
Henrique Godoy
OmniRetarget:面向人形机器人全身运动与操作及场景交互的交互保持型数据生成
Lujie Yang, Xiaoyu Huang, Zhen Wu, et al.
WildSpeech-Bench:在真实场景中对端到端SpeechLLM进行基准测试
Linhao Zhang, Jian Zhang, Bokai Lei, et al.
针对大型语言模型对齐的内部激活值的Token感知编辑
Tianbo Wang, Yuqing Ma, Kewei Liao, et al.
旨在学习:面向低资源视觉-语言建模的Token级动态门控
Bianca-Mihaela Ganescu, Suchir Salhan, Andrew Caines, et al.
通过早期经验进行Agent学习
Kai Zhang, Xiangchao Chen, Bo Liu, et al.
1
7
8
9
10
11
12
13
35