HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
Calligrapher:自由风格文本图像定制
扩散模型
文生图
Yue Ma, Qingyan Bai, Hao Ouyang, et al.
VMoBA:视频扩散模型中的块注意力混合方法
Transformer
视频生成
Jianzong Wu, Liang Hou, Haotian Yang, et al.
SMMILE:一种专家驱动的多模态医学情境学习基准
多模态
基准
Melanie Rieff, Maya Varma, Ossian Rabow, et al.
自动LLM速通基准:重现NanoGPT改进
基准
LLM
Bingchen Zhao, Despoina Magka, Minqi Jiang, et al.
Shape-for-Motion:基于3D代理的精确一致视频编辑
3D 模型
视频处理
Yuhao Liu, Tengfei Wang, Fang Liu, et al.
从理想到现实:面向实际场景的统一且数据高效的密集预测
语义分割
多任务学习
Changliang Xia, Chengyou Jia, Zhuohang Dang, et al.
ShotBench:视觉-语言模型中的专家级电影理解
视觉问答
多模态
Hongbo Liu, Jingwen He, Yi Jin, et al.
XVerse:通过DiT调制实现一致的多主体身份和语义属性控制
文生图
扩散模型
Bowen Chen, Mengyi Zhao, Haomiao Sun, et al.
24孔板中的零样本抗体设计
AI for Science
多模态
Chai Discovery Team
KinFormer:适用于催化有机反应动力学的通用动态符号回归
深度学习
建模
Jindou Chen, Jidong Tian, Liang Wu, et al.
MiCo:多图像对比强化视觉推理
推理
多模态
Xi Chen, Mingkang Zhu, Shaoteng Liu, et al.
细粒度偏好优化改进了VLM中的空间推理能力
推理
视觉问答
Yifan Shen, Yuanzhe Liu, Jingyuan Zhu, et al.
Ark:一个基于Python的开源机器人学习框架
机器人技术
具身智能
Magnus Dierking, Christopher E. Mower, Sarthak Das, et al.
Pangu Pro MoE:分组专家混合以实现高效的稀疏性
LLM
Transformer
Tang, Yehui, Li, et al.
LLaVA-Scissor:基于语义连通分量的视频大语言模型中的令牌压缩
视觉问答
多模态
Boyuan Sun, Jiaxing Zhao, Xihan Wei, et al.
BlenderFusion:基于3D的视觉编辑与生成合成
扩散模型
图像分割
Chen, Jiacheng, Mehran, et al.
UniMate:一种统一的机械超材料生成、性能预测及条件确认模型
多模态
多任务学习
Wangzhi Zhan, Jianpeng Chen, Dongqi Fu, et al.
学习跳过Transformer的中间层
Transformer
LLM
Tim Lawson, Laurence Aitchison
SAM4D:在相机和激光雷达流中分割任何物体
语义分割
多模态
Jianyun Xu, Song Wang, Ziqian Ni, et al.
在大型语言模型预训练中如何找到“Grokking”?监测从记忆到泛化的转变而不使用测试集
深度学习
自然语言处理
Ziyue Li, Chenrui Fan, Tianyi Zhou
FineWeb2:一管通天下——适应每种语言的预训练数据处理
数据集
LLM
Guilherme Penedo, Hynek Kydl\u00ed\u010dek, Vinko Sabol\u010dec, et al.
MADrive:增强记忆的驾驶场景建模
计算机视觉
自动驾驶
Polina Karpikova, Daniil Selikhanovych, Kirill Struminsky, et al.
FaSTA^*:用于高效多轮图像编辑的快速-慢速刀具路径代理与子程序挖掘
Agent
推理
Advait Gupta, Rishie Raj, Dang Nguyen, et al.
Mind2Web 2:评估代理搜索中的代理作为评判者
Agent
检索增强生成
Boyu Gou, Zanming Huang, Yuting Ning, et al.
WorldVLA:迈向自回归动作世界模型
Transformer
图像理解
Jun Cen, Chaohui Yu, Hangjie Yuan, et al.
ReCode:利用强化学习更新代码API知识
代码生成
LLM
Haoze Wu, Yunzhi Yao, Wenhao Yu, et al.
当生活给你样本:扩大多语言大模型推理计算的好处
LLM
多任务学习
Ammar Khairi, Daniel Dsouza, Ye Shen, et al.
HiWave:基于小波的扩散采样实现无训练高分辨率图像生成
扩散模型
图像生成
Tobias Vontobel, Seyedmorteza Sadat, Farnood Salehi, et al.
DualTHOR:一种用于应对意外情况规划的双臂类人机器人仿真平台
具身智能
机器人技术
Li, Boyu, He, et al.
MMSearch-R1:激励LMMs进行搜索
检索增强生成
视觉问答
Jinming Wu, Zihao Deng, Wei Li, et al.
OctoThinker:中期训练激励强化学习扩展
强化学习
模型训练
Zengzhi Wang, Fan Zhou, Xuefeng Li, et al.
AlphaGenome:利用统一的DNA序列模型推进调控变异效应预测
AI for Science
深度学习
\u017diga Avsec, Natasha Latysheva, Jun Cheng, et al.
1
42
43
44
45
46
47
48
49
Calligrapher:自由风格文本图像定制
扩散模型
文生图
Yue Ma, Qingyan Bai, Hao Ouyang, et al.
VMoBA:视频扩散模型中的块注意力混合方法
Transformer
视频生成
Jianzong Wu, Liang Hou, Haotian Yang, et al.
SMMILE:一种专家驱动的多模态医学情境学习基准
多模态
基准
Melanie Rieff, Maya Varma, Ossian Rabow, et al.
自动LLM速通基准:重现NanoGPT改进
基准
LLM
Bingchen Zhao, Despoina Magka, Minqi Jiang, et al.
Shape-for-Motion:基于3D代理的精确一致视频编辑
3D 模型
视频处理
Yuhao Liu, Tengfei Wang, Fang Liu, et al.
从理想到现实:面向实际场景的统一且数据高效的密集预测
语义分割
多任务学习
Changliang Xia, Chengyou Jia, Zhuohang Dang, et al.
ShotBench:视觉-语言模型中的专家级电影理解
视觉问答
多模态
Hongbo Liu, Jingwen He, Yi Jin, et al.
XVerse:通过DiT调制实现一致的多主体身份和语义属性控制
文生图
扩散模型
Bowen Chen, Mengyi Zhao, Haomiao Sun, et al.
24孔板中的零样本抗体设计
AI for Science
多模态
Chai Discovery Team
KinFormer:适用于催化有机反应动力学的通用动态符号回归
深度学习
建模
Jindou Chen, Jidong Tian, Liang Wu, et al.
MiCo:多图像对比强化视觉推理
推理
多模态
Xi Chen, Mingkang Zhu, Shaoteng Liu, et al.
细粒度偏好优化改进了VLM中的空间推理能力
推理
视觉问答
Yifan Shen, Yuanzhe Liu, Jingyuan Zhu, et al.
Ark:一个基于Python的开源机器人学习框架
机器人技术
具身智能
Magnus Dierking, Christopher E. Mower, Sarthak Das, et al.
Pangu Pro MoE:分组专家混合以实现高效的稀疏性
LLM
Transformer
Tang, Yehui, Li, et al.
LLaVA-Scissor:基于语义连通分量的视频大语言模型中的令牌压缩
视觉问答
多模态
Boyuan Sun, Jiaxing Zhao, Xihan Wei, et al.
BlenderFusion:基于3D的视觉编辑与生成合成
扩散模型
图像分割
Chen, Jiacheng, Mehran, et al.
UniMate:一种统一的机械超材料生成、性能预测及条件确认模型
多模态
多任务学习
Wangzhi Zhan, Jianpeng Chen, Dongqi Fu, et al.
学习跳过Transformer的中间层
Transformer
LLM
Tim Lawson, Laurence Aitchison
SAM4D:在相机和激光雷达流中分割任何物体
语义分割
多模态
Jianyun Xu, Song Wang, Ziqian Ni, et al.
在大型语言模型预训练中如何找到“Grokking”?监测从记忆到泛化的转变而不使用测试集
深度学习
自然语言处理
Ziyue Li, Chenrui Fan, Tianyi Zhou
FineWeb2:一管通天下——适应每种语言的预训练数据处理
数据集
LLM
Guilherme Penedo, Hynek Kydl\u00ed\u010dek, Vinko Sabol\u010dec, et al.
MADrive:增强记忆的驾驶场景建模
计算机视觉
自动驾驶
Polina Karpikova, Daniil Selikhanovych, Kirill Struminsky, et al.
FaSTA^*:用于高效多轮图像编辑的快速-慢速刀具路径代理与子程序挖掘
Agent
推理
Advait Gupta, Rishie Raj, Dang Nguyen, et al.
Mind2Web 2:评估代理搜索中的代理作为评判者
Agent
检索增强生成
Boyu Gou, Zanming Huang, Yuting Ning, et al.
WorldVLA:迈向自回归动作世界模型
Transformer
图像理解
Jun Cen, Chaohui Yu, Hangjie Yuan, et al.
ReCode:利用强化学习更新代码API知识
代码生成
LLM
Haoze Wu, Yunzhi Yao, Wenhao Yu, et al.
当生活给你样本:扩大多语言大模型推理计算的好处
LLM
多任务学习
Ammar Khairi, Daniel Dsouza, Ye Shen, et al.
HiWave:基于小波的扩散采样实现无训练高分辨率图像生成
扩散模型
图像生成
Tobias Vontobel, Seyedmorteza Sadat, Farnood Salehi, et al.
DualTHOR:一种用于应对意外情况规划的双臂类人机器人仿真平台
具身智能
机器人技术
Li, Boyu, He, et al.
MMSearch-R1:激励LMMs进行搜索
检索增强生成
视觉问答
Jinming Wu, Zihao Deng, Wei Li, et al.
OctoThinker:中期训练激励强化学习扩展
强化学习
模型训练
Zengzhi Wang, Fan Zhou, Xuefeng Li, et al.
AlphaGenome:利用统一的DNA序列模型推进调控变异效应预测
AI for Science
深度学习
\u017diga Avsec, Natasha Latysheva, Jun Cheng, et al.
1
42
43
44
45
46
47
48
49