HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
WebWeaver:通过动态大纲构建网络规模证据以支持开放式深度研究
检索增强生成
Agent
Zijian Li, Xin Guan, Bo Zhang, et al.
大型语言模型中的Glitch Tokens:分类体系与有效检测
LLM
Transformer
Yuxi Li, Yi Liu, Gelei Deng, et al.
REFRAG:重新思考基于RAG的解码
检索增强生成
LLM
Xiaoqiang Lin, Aritra Ghosh, Bryan Kian Hsiang Low, et al.
对齐后引导:通过统一潜在引导适应视觉-语言-动作模型
统一多模态
多任务学习
Yang Zhang, Chenwei Wang, Ouyang Lu, et al.
SubLIME:基于秩相关性预测的子集选择用于数据高效的LLM评估
LLM
数据集
Gayathri Saranathan, Cong Xu, Mahammad Parwez Alam, et al.
上下文混合用于长视频生成
视频生成
Transformer
Shengqu Cai, Ceyuan Yang, Lvmin Zhang, et al.
MusicSwarm:用于音乐创作的生物启发式智能
深度学习
建模
Markus J. Buehler
LEGO:张量应用的时空加速器生成与优化
AI 编译器
LLM
Yujun Lin, Zhekai Zhang, Song Han
LazyDrag:通过显式对应关系实现多模态扩散Transformer上的稳定拖拽编辑
扩散模型
多模态
Zixin Yin, Xili Dai, Duomin Wang, et al.
SearchInstruct:通过基于检索的指令数据集构建增强领域自适应
监督式微调
检索增强生成
Iman Barati, Mostafa Amiri, Heshaam Faili
可解释的物理推理与视觉-语言模型的性能分类体系
多模态
推理
Pranav Pawar, Kavish Shah, Akshat Bhalani, et al.
InternScenes:一个大规模可模拟室内场景数据集,具备真实布局
3D 模型
数据集
Weipeng Zhong, Peizhou Cao, Yichen Jin, et al.
UI-S1:通过半在线强化学习推进GUI自动化
强化学习
Agent
Zhengxi Lu, Jiabo Ye, Fei Tang, et al.
OmniWorld:用于4D世界建模的多领域多模态数据集
数据集
视频理解
Yang Zhou, Yifan Wang, Jianjun Zhou, et al.
LAVa:基于层级的KV缓存淘汰与动态预算分配
LLM
Transformer
Yiqun Shen, Song Yuan, Zhengze Zhang, et al.
基于概率结构融合的世界建模
建模
视频理解
Klemen Kotar, Wanhee Lee, Rahul Venkatesh, et al.
VStyle:一个基于口语指令的语音风格适配基准
语音生成
统一多模态
Jun Zhan, Mingyang Han, Yuxuan Xie, et al.
HANRAG:启发式高精度抗噪声多跳问答增强生成
检索增强生成
LLM
Duolin Sun, Dan Yang, Yue Shen, et al.
InfGen:一种与分辨率无关的可扩展图像合成范式
扩散模型
图像生成
Tao Han, Wanghan Xu, Junchao Gong, et al.
X-Part:高保真且结构一致的形状分解
3D 生成
语义分割
Xinhao Yan, Jiachen Xu, Yang Li, et al.
收益递减的错觉:LLM中长时 horizon 执行的度量
LLM
推理
Akshit Sinha, Arvindh Arun, Shashwat Goel, et al.
IntrEx:用于建模教育对话中参与度的数据集
数据集
LLM
Xingwei Tan, Mahathi Parvatham, Chiara Gambi, et al.
Youtu-GraphRAG:面向图检索增强型复杂推理的垂直统一Agent
检索增强生成
LLM
Junnan Dong, Siyu An, Yifei Yu, et al.
SceneSplat:基于视觉-语言预训练的高斯点云场景理解
机器视觉 3D
多模态表征
Yue Li, Qi Ma, Runyi Yang, et al.
虚拟 Agent 经济
Agent
偏好
Nenad Tomasev, Matija Franklin, Joel Z. Leibo, et al.
视觉语言模型中视觉定位的理解研究
多模态
多模态表征
Georgios Pantazopoulos, Eda B. Özyiğit
Kling-Avatar:用于级联长时长头像动画合成的多模态指令接地
统一多模态
多模态表征
Yikang Ding, Jiwen Liu, Wenyuan Zhang, et al.
机器学习LLM:在数百万个合成表格预测任务上持续预训练语言模型以实现上下文内机器学习
LLM
机器学习
Haoyu Dong, Pengkun Zhang, Mingzhe Lu, et al.
EchoX:通过回声训练缓解语音到语音LLM中的声学-语义鸿沟
LLM
语音生成
Yuhao Zhang, Yuhao Du, Zhanchen Dai, et al.
SimpleVLA-RL:通过强化学习扩展VLA训练
强化学习
监督式微调
Haozhan Li, Yuxin Zuo, Jiale Yu, et al.
VLA-Adapter:一种高效的小规模视觉-语言-动作模型范式
多模态
统一多模态
Yihao Wang, Pengxiang Ding, Lingxiao Li, et al.
scSiameseClu:一种用于解释单细胞RNA测序数据的孪生聚类框架
基因组学
深度学习
Ping Xu, Zhiyuan Ning, Pengjiang Li, et al.
1
27
28
29
30
31
32
33
49
WebWeaver:通过动态大纲构建网络规模证据以支持开放式深度研究
检索增强生成
Agent
Zijian Li, Xin Guan, Bo Zhang, et al.
大型语言模型中的Glitch Tokens:分类体系与有效检测
LLM
Transformer
Yuxi Li, Yi Liu, Gelei Deng, et al.
REFRAG:重新思考基于RAG的解码
检索增强生成
LLM
Xiaoqiang Lin, Aritra Ghosh, Bryan Kian Hsiang Low, et al.
对齐后引导:通过统一潜在引导适应视觉-语言-动作模型
统一多模态
多任务学习
Yang Zhang, Chenwei Wang, Ouyang Lu, et al.
SubLIME:基于秩相关性预测的子集选择用于数据高效的LLM评估
LLM
数据集
Gayathri Saranathan, Cong Xu, Mahammad Parwez Alam, et al.
上下文混合用于长视频生成
视频生成
Transformer
Shengqu Cai, Ceyuan Yang, Lvmin Zhang, et al.
MusicSwarm:用于音乐创作的生物启发式智能
深度学习
建模
Markus J. Buehler
LEGO:张量应用的时空加速器生成与优化
AI 编译器
LLM
Yujun Lin, Zhekai Zhang, Song Han
LazyDrag:通过显式对应关系实现多模态扩散Transformer上的稳定拖拽编辑
扩散模型
多模态
Zixin Yin, Xili Dai, Duomin Wang, et al.
SearchInstruct:通过基于检索的指令数据集构建增强领域自适应
监督式微调
检索增强生成
Iman Barati, Mostafa Amiri, Heshaam Faili
可解释的物理推理与视觉-语言模型的性能分类体系
多模态
推理
Pranav Pawar, Kavish Shah, Akshat Bhalani, et al.
InternScenes:一个大规模可模拟室内场景数据集,具备真实布局
3D 模型
数据集
Weipeng Zhong, Peizhou Cao, Yichen Jin, et al.
UI-S1:通过半在线强化学习推进GUI自动化
强化学习
Agent
Zhengxi Lu, Jiabo Ye, Fei Tang, et al.
OmniWorld:用于4D世界建模的多领域多模态数据集
数据集
视频理解
Yang Zhou, Yifan Wang, Jianjun Zhou, et al.
LAVa:基于层级的KV缓存淘汰与动态预算分配
LLM
Transformer
Yiqun Shen, Song Yuan, Zhengze Zhang, et al.
基于概率结构融合的世界建模
建模
视频理解
Klemen Kotar, Wanhee Lee, Rahul Venkatesh, et al.
VStyle:一个基于口语指令的语音风格适配基准
语音生成
统一多模态
Jun Zhan, Mingyang Han, Yuxuan Xie, et al.
HANRAG:启发式高精度抗噪声多跳问答增强生成
检索增强生成
LLM
Duolin Sun, Dan Yang, Yue Shen, et al.
InfGen:一种与分辨率无关的可扩展图像合成范式
扩散模型
图像生成
Tao Han, Wanghan Xu, Junchao Gong, et al.
X-Part:高保真且结构一致的形状分解
3D 生成
语义分割
Xinhao Yan, Jiachen Xu, Yang Li, et al.
收益递减的错觉:LLM中长时 horizon 执行的度量
LLM
推理
Akshit Sinha, Arvindh Arun, Shashwat Goel, et al.
IntrEx:用于建模教育对话中参与度的数据集
数据集
LLM
Xingwei Tan, Mahathi Parvatham, Chiara Gambi, et al.
Youtu-GraphRAG:面向图检索增强型复杂推理的垂直统一Agent
检索增强生成
LLM
Junnan Dong, Siyu An, Yifei Yu, et al.
SceneSplat:基于视觉-语言预训练的高斯点云场景理解
机器视觉 3D
多模态表征
Yue Li, Qi Ma, Runyi Yang, et al.
虚拟 Agent 经济
Agent
偏好
Nenad Tomasev, Matija Franklin, Joel Z. Leibo, et al.
视觉语言模型中视觉定位的理解研究
多模态
多模态表征
Georgios Pantazopoulos, Eda B. Özyiğit
Kling-Avatar:用于级联长时长头像动画合成的多模态指令接地
统一多模态
多模态表征
Yikang Ding, Jiwen Liu, Wenyuan Zhang, et al.
机器学习LLM:在数百万个合成表格预测任务上持续预训练语言模型以实现上下文内机器学习
LLM
机器学习
Haoyu Dong, Pengkun Zhang, Mingzhe Lu, et al.
EchoX:通过回声训练缓解语音到语音LLM中的声学-语义鸿沟
LLM
语音生成
Yuhao Zhang, Yuhao Du, Zhanchen Dai, et al.
SimpleVLA-RL:通过强化学习扩展VLA训练
强化学习
监督式微调
Haozhan Li, Yuxin Zuo, Jiale Yu, et al.
VLA-Adapter:一种高效的小规模视觉-语言-动作模型范式
多模态
统一多模态
Yihao Wang, Pengxiang Ding, Lingxiao Li, et al.
scSiameseClu:一种用于解释单细胞RNA测序数据的孪生聚类框架
基因组学
深度学习
Ping Xu, Zhiyuan Ning, Pengjiang Li, et al.
1
27
28
29
30
31
32
33
49