HyperAI超神经

Qingyan Bai, Qiuyu Wang, Hao Ouyang, et al.

合成

OmniVinci：提升架构与数据以实现全模态理解 LLM

Hanrong Ye, Chao-Han Huck Yang, Arushi Goel, et al.

关于LLM推理中内部概率与自洽性衔接的理论研究

推理

Zhi Zhou, Yuhao Tan, Zenan Li, et al.

DeepSeek-OCR：上下文光学压缩

OCR

Haoran Wei, Yaofeng Sun, Yukun Li

带有未观测偏好异质性的直接偏好优化：三元偏好必要性

偏好

Keertana Chidambaram, Karthik Vinary Seetharaman, Vasilis Syrgkanis

用于概率天气预报的滚动扩散模型阐释

扩散模型

深度学习

Salva Rühling Cachay, Miika Aittala, Karsten Kreis, et al.

图像搜索：超越语义依赖约束的视频生成自适应测试时搜索

Meiqi Wu, Jiashu Zhu, Xiaokun Feng, et al.

文生视频

从像素到文字——迈向大规模原生视觉-语言原子单元

Haiwen Diao, Mingxuan Li, Silei Wu, et al.

面向服务的AI：通过AI眼镜实现主动辅助

Zichen Wen, Yiyu Wang, Chenfei Liao, et al.

WithAnyone：迈向可控且ID一致的图像生成

文生图

图像生成

Hengyuan Xu, Wei Cheng, Peng Xing, et al.

代理熵平衡策略优化

强化学习

Guanting Dong, Licheng Bao, Zhongyuan Wang, et al.

当模型说谎时，我们得以学习：基于PsiloQA的多语言跨度级幻觉检测

数据集

Elisei Rykov, Kseniia Petrushina, Maksim Savkin, et al.

基于深度学习预测多模板PCR中的序列特异性扩增效率

深度学习

卷积神经网络

Andreas L. Gimpel, Bowen Fan, Dexiong Chen, et al.

基因组分析工具：一种用于分析下一代DNA测序数据的MapReduce框架

基因组学

高性能计算

Aaron McKenna, Matthew Hanna, Eric Banks, et al.

LAMMPS - 一种用于原子、介观和连续尺度下基于粒子材料建模的灵活模拟工具

建模

高性能计算

Aidan P. Thompson, H. Metin Aktulga, Richard Berger, et al.

LabOS：能够感知并协同人类的AI-XR共科研人员

Le Cong, Zaixi Zhang, Xiaotong Wang, et al.

海豚：基于异构锚点提示的文档图像解析

文档理解

Hao Feng, Shu Wei, Xiang Fei, et al.

LiveCC：基于大规模流式语音转录学习视频LLM

Joya Chen, Ziyun Zeng, Yiqi Lin, et al.

视觉问答

DeepMMSearch-R1：赋能多模态LLM在多模态网络搜索中的应用

视觉问答

检索增强生成

Kartik Narayan, Yang Xu, Tian Cao, et al.

用于下一代单细胞分析的大型语言模型扩展

Syed Asad Rizvi, Daniel Levine, Aakash Patel, et al.

AI for Science

基于大语言模型的氛围编码综述

Yuyao Ge, Lingrui Mei, Zenghao Duan, et al.

通过下一位置预测检测任何内容

目标检测

Qing Jiang, Junan Huo, Xingyu Chen, et al.

面向语言中心的多模态表征学习的扩展

Chenghao Xiao, Hou Pong Chan, Hao Zhang, et al.

DITING：用于基准测试网络小说翻译的多Agent评估框架

翻译

Enze Zhang, Jiaying Wang, Mengxi Xiao, et al.

通过自监督预训练推进端到端像素空间生成建模

扩散模型

图像生成

Jiachen Lei, Keli Liu, Julius Berner, et al.

空间强制：面向视觉-语言-动作模型的隐式空间表征对齐

Fuhao Li, Wenxuan Song, Han Zhao, et al.

基于大型语言模型的偏好获取中的澄清性问题提问

偏好

Ali Montazeralghaem, Guy Tennenholtz, Craig Boutilier, et al.

CTRL-Rec：通过自然语言控制推荐系统

偏好

自然语言处理

Micah Carroll, Adeline Foote, Kevin Feng, et al.

RLFR：通过流环境扩展用于LLM的强化学习

强化学习

Jinghao Zhang, Naishan Zheng, Ruilin Li, et al.

潜在精炼解码：通过精炼信念状态增强基于扩散的LLM

扩散模型

文本生成

Qinglin Zhu, Yizhen Yao, Runcong Zhao, et al.

OmniVideoBench：面向全景多模态大模型的音视频理解评估

视频理解

Caorui Li, Yu Chen, Yiyan Ji, et al.

BEAR：面向原子化具身能力的多模态语言模型基准测试与增强