最新论文
每日更新的前沿 AI 研究论文,助您把握人工智能最新动向

NavDP:利用特权信息引导学习从模拟到现实的导航扩散策略
Wenzhe Cai, Jiaqi Peng, Yuqiang Yang, et al.
发布日期: 5/14/2025

Aya Vision:推进多语言多模态的前沿
Saurabh Dash, Yiyang Nan, John Dang, et al.
发布日期: 5/14/2025

MiniMax-Speech:具有可学习说话人编码器的内在零样本文本到语音合成
Bowen Zhang, Congchao Guo, Geng Yang, et al.
发布日期: 5/14/2025

SkillFormer:统一多视角视频理解以评估熟练度
Edoardo Bianchi, Antonio Liotta
发布日期: 5/14/2025

通过扩散模型从纳米晶粉末衍射数据中得到从头算结构解
Gabe Guo, Tristan Luca Saidi, Maxwell W. Terban, et al.
发布日期: 5/14/2025

MiMo:释放语言模型的推理潜力——从预训练到后训练
Xiaomi LLM-Core Team: Bingquan Xia, Bowen Shen, Cici, et al.
发布日期: 5/14/2025

Seed1.5-VL Technical Report
Dong Guo, Faming Wu, Feida Zhu, et al.
发布日期: 5/14/2025

迈向多模态通才:通用水平与通用基准
Hao Fei, Yuan Zhou, Juncheng Li, et al.
发布日期: 5/13/2025

感知、推理、思考与规划:大规模多模态推理模型综述
Yunxin Li, Zhenyu Liu, Zitao Li, et al.
发布日期: 5/13/2025

统一的多模态理解与生成模型:进展、挑战与机遇
Xinjie Zhang, Jintao Guo, Shanshan Zhao, et al.
发布日期: 5/13/2025