Command Palette
Search for a command to run...
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

Voxify3D:像素艺术邂逅体素渲染

DoVer:基于干预驱动的LLM多智能体系统自动调试































Voxify3D:像素艺术邂逅体素渲染

DoVer:基于干预驱动的LLM多智能体系统自动调试






























基于时序推理的统一视频编辑
超越真实:用于长上下文LLM的旋转位置编码的虚数扩展
原生并行推理器:通过自蒸馏强化学习实现并行推理
iSeal:用于可靠LLM所有权验证的加密指纹技术
DAVSP:通过深度对齐视觉安全提示实现大视觉-语言模型的安全对齐
WorldGen:从文本到可通行且可交互的3D世界
超级模型:简单算术如何解锁最先进的LLM性能
DTS:通过解码树草图增强大型推理模型
基于LLMs的贝叶斯优化自适应核设计宛如轻而易举之事
DePass:通过简单分解前向传播实现统一特征归因
COOPER:面向空间智能的协同感知与推理统一模型
从模仿到判别:迈向一种增强跨领域推理任务的通用课程优势机制
PaCo-RL:基于成对奖励建模的强化学习在一致图像生成中的应用进展
EMMA:基于统一架构的高效多模态理解、生成与编辑
EditThinker:解锁任意图像编辑器的迭代推理能力
TwinFlow:基于自对抗流实现大模型的一步生成
CARE-PD:用于帕金森病步态评估的多中心匿名临床数据集
WenetSpeech-Chuan:一个用于方言语音处理的大规模四川话语料库,具有丰富的标注信息
PolypSense3D:用于内窥镜深度感知息肉尺寸测量的多源基准数据集
PhysDrive:面向车载驾驶员监控的多模态远程生理测量数据集
人工蜂群智能:语言模型(及更广泛领域)的开放性同质性
OmniSVG:一种统一的可扩展矢量图形生成模型
算法思维理论
机器人世界模型:用于机器人鲁棒策略优化的神经网络模拟器
奖励强制:基于奖励分布匹配蒸馏的高效流式视频生成
语义引领方向:通过异步潜在扩散实现语义与纹理建模的协同
ARM-Thinker:通过智能体工具使用与视觉推理强化多模态生成式奖励模型
Nex-N1:通过统一生态系统训练的智能体模型,用于大规模环境构建
DAComp:面向数据智能全生命周期的数据Agent基准测试
实时虚拟形象:基于实时音频驱动的无限长度虚拟形象生成
基于时序推理的统一视频编辑
超越真实:用于长上下文LLM的旋转位置编码的虚数扩展
原生并行推理器:通过自蒸馏强化学习实现并行推理
iSeal:用于可靠LLM所有权验证的加密指纹技术
DAVSP:通过深度对齐视觉安全提示实现大视觉-语言模型的安全对齐
WorldGen:从文本到可通行且可交互的3D世界
超级模型:简单算术如何解锁最先进的LLM性能
DTS:通过解码树草图增强大型推理模型
基于LLMs的贝叶斯优化自适应核设计宛如轻而易举之事
DePass:通过简单分解前向传播实现统一特征归因
COOPER:面向空间智能的协同感知与推理统一模型
从模仿到判别:迈向一种增强跨领域推理任务的通用课程优势机制
PaCo-RL:基于成对奖励建模的强化学习在一致图像生成中的应用进展
EMMA:基于统一架构的高效多模态理解、生成与编辑
EditThinker:解锁任意图像编辑器的迭代推理能力
TwinFlow:基于自对抗流实现大模型的一步生成
CARE-PD:用于帕金森病步态评估的多中心匿名临床数据集
WenetSpeech-Chuan:一个用于方言语音处理的大规模四川话语料库,具有丰富的标注信息
PolypSense3D:用于内窥镜深度感知息肉尺寸测量的多源基准数据集
PhysDrive:面向车载驾驶员监控的多模态远程生理测量数据集
人工蜂群智能:语言模型(及更广泛领域)的开放性同质性
OmniSVG:一种统一的可扩展矢量图形生成模型
算法思维理论
机器人世界模型:用于机器人鲁棒策略优化的神经网络模拟器
奖励强制:基于奖励分布匹配蒸馏的高效流式视频生成
语义引领方向:通过异步潜在扩散实现语义与纹理建模的协同
ARM-Thinker:通过智能体工具使用与视觉推理强化多模态生成式奖励模型
Nex-N1:通过统一生态系统训练的智能体模型,用于大规模环境构建
DAComp:面向数据智能全生命周期的数据Agent基准测试
实时虚拟形象:基于实时音频驱动的无限长度虚拟形象生成