HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
Mol-R1:面向分子发现中显式长链思维推理
LLM
监督式微调
Jiatong Li, Weida Wang, Qinggang Zhang, et al.
Llama-Nemotron:高效推理模型
LLM
推理
Akhiad Bercovich, Itay Levy, Izik Golan, et al.
Document Haystack:一个长上下文多模态图像/文档理解视觉LLM基准
文档理解
视觉文档检索
Goeric Huybrechts, Srikanth Ronanki, Sai Muralidhar Jayanthi, et al.
Echo-4o:利用GPT-4o合成图像提升图像生成性能
文生图
数据集
Junyan Ye, Dongzhi Jiang, Zihao Wang, et al.
无标记组织在成像质谱中的虚拟染色
计算机视觉
图像理解
Yijie Zhang, Luzhe Huang, Nir Pillar, et al.
VisCodex:通过融合视觉与编码模型实现统一的多模态代码生成
代码生成
多模态表征
Lingjie Jiang, Shaohan Huang, Xun Wu, et al.
HierSearch:一种集成本地搜索与网络搜索的分层企业深度搜索框架
检索增强生成
Agent
Jiejun Tan, Zhicheng Dou, Yan Yu, et al.
时间是一种特征:在扩散语言模型中利用时间动态特性
扩散模型
推理
Wen Wang, Bozhen Fang, Chenchen Jing, et al.
CharacterShot:可控且一致的4D角色动画
图生视频
3D 生成
Junyao Gao, Jiaxing Li, Wenran Liu, et al.
超越十轮:基于大规模异步强化学习的长周期智能体搜索
强化学习
智能问答
Jiaxuan Gao, Wei Fu, Minyang Xie, et al.
Matrix-3D:全向可探索的3D世界生成
3D 生成
图生视频
Zhongqi Yang, Wenhang Ge, Yuqi Li, et al.
WebWatcher:开拓视觉-语言深度研究Agent的新疆界
视觉问答
多模态
Xinyu Geng, Peng Xia, Zhen Zhang, et al.
Marco-Voice 技术报告
语音生成
统一多模态
Fengping Tian, Chenyang Lyu, Xuanfan Ni, et al.
Kimina-Prover 预览:基于强化学习的大型形式化推理模型探索
LLM
推理
Haiming Wang, Mert Unsal, Xiaohan Lin, et al.
PyVeritas:基于LLM的转译与C语言的有界模型检测的Python验证
LLM
AI 编译器
Pedro Orvalho, Marta Kwiatkowska
内在记忆智能体:通过结构化上下文记忆实现的异构多智能体LLM系统
Agent
LLM
Sizhe Yuen, Francisco Gomez Medina, Ting Su, et al.
通过建模CRISPR–Cas序列设计高功能基因组编辑器
AI for Science
自然语言处理
Jeffrey A. Ruffolo, Stephen Nayfach, Joseph Gallagher, et al.
UserBench:面向以用户为中心的Agent的交互式Gym环境
Agent
基准
Cheng Qian, Zuxin Liu, Akshara Prabhakar, et al.
SONAR-LLM:一种在句子嵌入中思考并在token中表达的自回归Transformer
Transformer
LLM
Nikita Dragunov, Temurbek Rahmatullaev, Elizaveta Goncharova, et al.
Klear-Reasoner:通过梯度保真裁剪策略优化提升推理能力
监督式微调
LLM
Zhenpeng Su, Leiyu Pan, Xue Bai, et al.
全效应:统一且空间可控制的视觉效果生成
图生视频
文生视频
Fangyuan Mao, Aiming Hao, Jintao Chen, et al.
WideSearch:面向智能体的广域信息搜索基准测试
基准
Agent
Ryan Wong, Jiawei Wang, Junjie Zhao, et al.
ReasonRank:通过强大的推理能力赋能段落排序
LLM
推理
Wenhan Liu, Xinyu Ma, Weiwei Sun, et al.
AdaptFlow:基于元学习的自适应工作流优化
LLM
Agent
Runchuan Zhu, Bowen Jiang, Lingrui Mei, et al.
中介引导的开源模型间多智能体协作用于医疗决策
视觉问答
Agent
Kaitao Chen, Mianxin Liu, Daoming Zong, et al.
无标签视觉-语言模型适应:一项全面综述
多模态表征
统一多模态
Hao Dong, Lijun Sheng, Jian Liang, et al.
GENIE:用于神经辐射场交互编辑的高斯编码
3D 模型
机器视觉 3D
Mikołaj Zieliński, Krzysztof Byrski, Tomasz Szczepanik, et al.
剪枝无惊喜:通过首令牌意外性实现高效的代码推理
代码生成
推理
Wenhao Zeng, Yaoning Wang, Chao Hu, et al.
Voost:一种用于双向虚拟试穿与试脱的统一且可扩展的扩散Transformer
扩散模型
图像修复
Seungyong Lee, Jeong-gi Kwak
InfiGUI-G1:通过自适应探索策略优化推进GUI定位
Agent
视觉问答
Yuhang Liu, Zeyu Liu, Shuanghe Zhu, et al.
Memp:探索Agent程序记忆
Agent
LLM
Runnan Fang, Yuan Liang, Xiaobin Wang, et al.
Perch 2.0:对生物声学的鹬鸟启示
音频分类
多任务学习
Bart van Merriënboer, Vincent Dumoulin, Jenny Hamer, et al.
1
34
35
36
37
38
39
40
49
Mol-R1:面向分子发现中显式长链思维推理
LLM
监督式微调
Jiatong Li, Weida Wang, Qinggang Zhang, et al.
Llama-Nemotron:高效推理模型
LLM
推理
Akhiad Bercovich, Itay Levy, Izik Golan, et al.
Document Haystack:一个长上下文多模态图像/文档理解视觉LLM基准
文档理解
视觉文档检索
Goeric Huybrechts, Srikanth Ronanki, Sai Muralidhar Jayanthi, et al.
Echo-4o:利用GPT-4o合成图像提升图像生成性能
文生图
数据集
Junyan Ye, Dongzhi Jiang, Zihao Wang, et al.
无标记组织在成像质谱中的虚拟染色
计算机视觉
图像理解
Yijie Zhang, Luzhe Huang, Nir Pillar, et al.
VisCodex:通过融合视觉与编码模型实现统一的多模态代码生成
代码生成
多模态表征
Lingjie Jiang, Shaohan Huang, Xun Wu, et al.
HierSearch:一种集成本地搜索与网络搜索的分层企业深度搜索框架
检索增强生成
Agent
Jiejun Tan, Zhicheng Dou, Yan Yu, et al.
时间是一种特征:在扩散语言模型中利用时间动态特性
扩散模型
推理
Wen Wang, Bozhen Fang, Chenchen Jing, et al.
CharacterShot:可控且一致的4D角色动画
图生视频
3D 生成
Junyao Gao, Jiaxing Li, Wenran Liu, et al.
超越十轮:基于大规模异步强化学习的长周期智能体搜索
强化学习
智能问答
Jiaxuan Gao, Wei Fu, Minyang Xie, et al.
Matrix-3D:全向可探索的3D世界生成
3D 生成
图生视频
Zhongqi Yang, Wenhang Ge, Yuqi Li, et al.
WebWatcher:开拓视觉-语言深度研究Agent的新疆界
视觉问答
多模态
Xinyu Geng, Peng Xia, Zhen Zhang, et al.
Marco-Voice 技术报告
语音生成
统一多模态
Fengping Tian, Chenyang Lyu, Xuanfan Ni, et al.
Kimina-Prover 预览:基于强化学习的大型形式化推理模型探索
LLM
推理
Haiming Wang, Mert Unsal, Xiaohan Lin, et al.
PyVeritas:基于LLM的转译与C语言的有界模型检测的Python验证
LLM
AI 编译器
Pedro Orvalho, Marta Kwiatkowska
内在记忆智能体:通过结构化上下文记忆实现的异构多智能体LLM系统
Agent
LLM
Sizhe Yuen, Francisco Gomez Medina, Ting Su, et al.
通过建模CRISPR–Cas序列设计高功能基因组编辑器
AI for Science
自然语言处理
Jeffrey A. Ruffolo, Stephen Nayfach, Joseph Gallagher, et al.
UserBench:面向以用户为中心的Agent的交互式Gym环境
Agent
基准
Cheng Qian, Zuxin Liu, Akshara Prabhakar, et al.
SONAR-LLM:一种在句子嵌入中思考并在token中表达的自回归Transformer
Transformer
LLM
Nikita Dragunov, Temurbek Rahmatullaev, Elizaveta Goncharova, et al.
Klear-Reasoner:通过梯度保真裁剪策略优化提升推理能力
监督式微调
LLM
Zhenpeng Su, Leiyu Pan, Xue Bai, et al.
全效应:统一且空间可控制的视觉效果生成
图生视频
文生视频
Fangyuan Mao, Aiming Hao, Jintao Chen, et al.
WideSearch:面向智能体的广域信息搜索基准测试
基准
Agent
Ryan Wong, Jiawei Wang, Junjie Zhao, et al.
ReasonRank:通过强大的推理能力赋能段落排序
LLM
推理
Wenhan Liu, Xinyu Ma, Weiwei Sun, et al.
AdaptFlow:基于元学习的自适应工作流优化
LLM
Agent
Runchuan Zhu, Bowen Jiang, Lingrui Mei, et al.
中介引导的开源模型间多智能体协作用于医疗决策
视觉问答
Agent
Kaitao Chen, Mianxin Liu, Daoming Zong, et al.
无标签视觉-语言模型适应:一项全面综述
多模态表征
统一多模态
Hao Dong, Lijun Sheng, Jian Liang, et al.
GENIE:用于神经辐射场交互编辑的高斯编码
3D 模型
机器视觉 3D
Mikołaj Zieliński, Krzysztof Byrski, Tomasz Szczepanik, et al.
剪枝无惊喜:通过首令牌意外性实现高效的代码推理
代码生成
推理
Wenhao Zeng, Yaoning Wang, Chao Hu, et al.
Voost:一种用于双向虚拟试穿与试脱的统一且可扩展的扩散Transformer
扩散模型
图像修复
Seungyong Lee, Jeong-gi Kwak
InfiGUI-G1:通过自适应探索策略优化推进GUI定位
Agent
视觉问答
Yuhang Liu, Zeyu Liu, Shuanghe Zhu, et al.
Memp:探索Agent程序记忆
Agent
LLM
Runnan Fang, Yuan Liang, Xiaobin Wang, et al.
Perch 2.0:对生物声学的鹬鸟启示
音频分类
多任务学习
Bart van Merriënboer, Vincent Dumoulin, Jenny Hamer, et al.
1
34
35
36
37
38
39
40
49