HyperAI
HyperAI超神经
首页
算力平台
文档
资讯
论文
教程
数据集
百科
SOTA
LLM 模型天梯
GPU 天梯
顶会
开源项目
全站搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI超神经
Toggle Sidebar
全站搜索…
⌘
K
Command Palette
Search for a command to run...
算力平台
首页
论文
论文
每日更新的前沿 AI 研究论文,助您把握人工智能最新动向
论文 | HyperAI超神经
通过模型、数据和测试时扩展,拓展开源多模态模型的性能边界
Zhe Chen, Weiyun Wang, Yue Cao, et al.
NVILA:高效前沿视觉语言模型
Zhijian Liu, Ligeng Zhu, Baifeng Shi, et al.
VisionZip:在视觉语言模型中,更长并不一定更好
Senqiao Yang, Yukang Chen, Zhuotao Tian, et al.
百川Omni技术报告
Yadong Li, Haoze Sun, Mingan Lin, et al.
MM1.5:多模态LLM微调的方法、分析与洞见
Haotian Zhang, Mingfei Gao, Zhe Gan, et al.
Emu3:下一token预测就是你所需的一切
Xinlong Wang, Xiaosong Zhang, Zhengxiong Luo, et al.
CogVLM2:用于图像与视频理解的视觉语言模型
Wenyi Hong, Weihan Wang, Ming Ding, et al.
Qwen2 技术报告
An Yang, Baosong Yang, Binyuan Hui, et al.
一张图像对于重建和生成而言价值32个token
Qihang Yu, Mark Weber, Xueqing Deng, et al.
自回归模型胜过扩散模型:Llama 实现可扩展的图像生成
Peize Sun, Yi Jiang, Shoufa Chen, et al.
Meteor:基于Mamba的大型语言与视觉模型推理路径遍历
Byung-Kwan Lee, Chae Won Kim, Beomchan Park, et al.
FIFO-Diffusion:无需训练从文本生成无限视频
Jihwan Kim, Junoh Kang, Jinyoung Choi, et al.
我们距离GPT-4V还有多远?通过开源套件缩小与商业多模态模型的差距
Zhe Chen, Weiyun Wang, Hao Tian, et al.
通过想象、搜索与批判实现LLM的自我改进
Ye Tian, Baolin Peng, Linfeng Song, et al.
OmniFusion 技术报告
Elizaveta Goncharova, Anton Razzhigaev, Matvey Mikhalchuk, et al.
SEAgent:具备从经验中自主学习能力的自演化计算机使用代理
Zeyi Sun, Ziyu Liu, Yuhang Zang, et al.
AMix-1:通往测试时可扩展蛋白质基础模型的路径
Changze Lv, Jiang Zhou, Siyu Long, et al.
CRINN:用于近似最近邻搜索的对比强化学习
Xiaoya Li, Xiaofei Sun, Albert Wang, et al.
表示偏移:统一令牌压缩与FlashAttention
Joonmyung Choi, Sanghyeok Lee, Byungoh Ko, et al.
CompassVerifier:一种统一且鲁棒的LLM评估与结果奖励验证器
Shudong Liu, Hongwei Liu, Junnan Liu, et al.
LongVie:多模态引导的可控超长视频生成
Jianxiong Gao, Zhaoxi Chen, Xian Liu, et al.
Skywork UniPic:面向视觉理解与生成的统一自回归建模
Peiyu Wang, Yi Peng, Yimeng Gan, et al.
Seed Diffusion:一种具备高速推理能力的大规模扩散语言模型
\Yuxuan Song\, \ Zheng Zhang\, \ Cheng Luo\, et al.
Agent Lightning:使用强化学习训练任意AI Agent
Xufang Luo, Yuge Zhang, Zhiyuan He, et al.
基于LLM指导的进化蒙特卡洛树搜索的引力波探测自动化算法发现
He Wang, Liang Zeng
超越权衡:用于推理模型指令遵循的自监督强化学习
Qingyu Ren, Qianyu He, Bowei Zhang, et al.
Llama-3.1-基础AI安全LLM-8B-指令 技术报告
Sajana Weerawardhena, Paul Kassianik, Blaine Nelson, et al.
CellForge:虚拟细胞模型的智能体设计
Xiangru Tang, Zhuoyun Yu, Jiapeng Chen, et al.
SitEmb-v1.5:面向语义关联与长故事理解的改进型上下文感知密集检索
Junjie Wu, Jiangnan Li, Yuqing Li, et al.
通义千问-图像技术报告
Chenfei Wu, Jiahao Li, Jingren Zhou, et al.
RL-PLUS:基于混合策略优化的LLM强化学习能力边界坍塌对抗方法
Yihong Dong, Xue Jiang, Yongding Tao, et al.
GS-Occ3D:基于高斯点阵的纯视觉占据重建扩展
Baijun Ye, Minghui Qin, Saining Zhang, et al.
1
21
22
23
24
25
26
27
35