Command Palette
Search for a command to run...
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

Qwen-Image-Flash:超越目标设计

OVO-S-Bench:面向多模态大语言模型流式空间智能的分层基准

复现、分析与检测基于评分标准的强化学习中的奖励黑客攻击

深度研究 Agents 在哪里出错?Agent 轨迹中的跨度级错误定位

音频交互模型

Cosmos 3:面向物理AI的全模态世界模型

学习与快慢思维:迈向具备持续适应能力的 LLM

LEAP:利用智能体框架为大型语言模型在形式化数学领域的赋能增效

世界模型遇见语言模型:论具体与抽象推理的互补性

从激活到因果:人类大脑中因果视觉表征的发现

一种用于多域强化学习中跨域干扰与恢复的局部扰动理论

人形-GPT:用于零样本运动跟踪的数据与结构扩展

信任域同策略蒸馏

OCC-RAG:面向忠实问答的最优认知核心

MAI-Thinking-1:构建爬山算法

VLM3:视觉语言模型是原生3D学习者

Harness-1:利用状态外化 Harness 进行搜索代理的强化学习

DeepCrack:一种用于裂纹分割的深度层次化特征学习架构

VideoMLA:用于分钟级自回归视频扩散的低秩潜在KV缓存

Draft-OPD:面向投机草稿模型的在线策略蒸馏

K-BrowseComp:基于韩国语境的 Web 浏览 Agent 基准测试

关键在于TASTE:提升 Agent 基准的覆盖率与难度

关于 PEFT 的扩展:迈向万亿参数的百万级个性化模型

Crafter:用于从多样化输入生成可编辑科学图表的多 Agent 框架

TACK:针对新型靶向嵌合体知识数据集(TArgeting Chimeras Knowledge)的降解活性统计评估

叙事织者:基于多模态条件控制的长程视觉一致性研究

框架更新并非框架增益:解耦自进化大语言模型智能体中的进化能力

LongTraceRL:从搜索 Agent 轨迹与评分标准奖励中学习长上下文推理

用于同策略蒸馏的信赖域行为混合

SwanVoice:面向独白与对话的富有表现力长文本零样本语音合成

面向无瓶颈统一多模态模型的表示强制

GrepSeek:用于直接语料库交互的搜索 Agents 训练

Qwen-Image-Flash:超越目标设计

OVO-S-Bench:面向多模态大语言模型流式空间智能的分层基准

复现、分析与检测基于评分标准的强化学习中的奖励黑客攻击

深度研究 Agents 在哪里出错?Agent 轨迹中的跨度级错误定位

音频交互模型

Cosmos 3:面向物理AI的全模态世界模型

学习与快慢思维:迈向具备持续适应能力的 LLM

LEAP:利用智能体框架为大型语言模型在形式化数学领域的赋能增效

世界模型遇见语言模型:论具体与抽象推理的互补性

从激活到因果:人类大脑中因果视觉表征的发现

一种用于多域强化学习中跨域干扰与恢复的局部扰动理论

人形-GPT:用于零样本运动跟踪的数据与结构扩展

信任域同策略蒸馏

OCC-RAG:面向忠实问答的最优认知核心

MAI-Thinking-1:构建爬山算法

VLM3:视觉语言模型是原生3D学习者

Harness-1:利用状态外化 Harness 进行搜索代理的强化学习

DeepCrack:一种用于裂纹分割的深度层次化特征学习架构

VideoMLA:用于分钟级自回归视频扩散的低秩潜在KV缓存

Draft-OPD:面向投机草稿模型的在线策略蒸馏

K-BrowseComp:基于韩国语境的 Web 浏览 Agent 基准测试

关键在于TASTE:提升 Agent 基准的覆盖率与难度

关于 PEFT 的扩展:迈向万亿参数的百万级个性化模型

Crafter:用于从多样化输入生成可编辑科学图表的多 Agent 框架

TACK:针对新型靶向嵌合体知识数据集(TArgeting Chimeras Knowledge)的降解活性统计评估

叙事织者:基于多模态条件控制的长程视觉一致性研究

框架更新并非框架增益:解耦自进化大语言模型智能体中的进化能力

LongTraceRL:从搜索 Agent 轨迹与评分标准奖励中学习长上下文推理

用于同策略蒸馏的信赖域行为混合

SwanVoice:面向独白与对话的富有表现力长文本零样本语音合成

面向无瓶颈统一多模态模型的表示强制

GrepSeek:用于直接语料库交互的搜索 Agents 训练