Command Palette
Search for a command to run...
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

RelayFormer:一种用于可扩展图像与视频操纵定位的统一局部-全局注意力框架

GMF-Drive:具有空间感知BEV表示的门控Mamba融合用于端到端自动驾驶































RelayFormer:一种用于可扩展图像与视频操纵定位的统一局部-全局注意力框架

GMF-Drive:具有空间感知BEV表示的门控Mamba融合用于端到端自动驾驶






























看、听、记、思:具备长期记忆的多模态Agent
扩散型LLM可通过离散扩散强制实现快于自回归的推理
AWorld:具有稳定机动性的动态多Agent系统,用于鲁棒的GAIA问题求解
Story2Board:一种无需训练的富有表现力的分镜生成方法
替身:一种轻量级且即插即用的视频生成身份控制方法
Mol-R1:面向分子发现中显式长链思维推理
Llama-Nemotron:高效推理模型
Document Haystack:一个长上下文多模态图像/文档理解视觉LLM基准
Echo-4o:利用GPT-4o合成图像提升图像生成性能
无标记组织在成像质谱中的虚拟染色
VisCodex:通过融合视觉与编码模型实现统一的多模态代码生成
HierSearch:一种集成本地搜索与网络搜索的分层企业深度搜索框架
时间是一种特征:在扩散语言模型中利用时间动态特性
CharacterShot:可控且一致的4D角色动画
超越十轮:基于大规模异步强化学习的长周期智能体搜索
Matrix-3D:全向可探索的3D世界生成
WebWatcher:开拓视觉-语言深度研究Agent的新疆界
Marco-Voice 技术报告
Kimina-Prover 预览:基于强化学习的大型形式化推理模型探索
PyVeritas:基于LLM的转译与C语言的有界模型检测的Python验证
内在记忆智能体:通过结构化上下文记忆实现的异构多智能体LLM系统
通过建模CRISPR–Cas序列设计高功能基因组编辑器
UserBench:面向以用户为中心的Agent的交互式Gym环境
SONAR-LLM:一种在句子嵌入中思考并在token中表达的自回归Transformer
Klear-Reasoner:通过梯度保真裁剪策略优化提升推理能力
全效应:统一且空间可控制的视觉效果生成
WideSearch:面向智能体的广域信息搜索基准测试
ReasonRank:通过强大的推理能力赋能段落排序
AdaptFlow:基于元学习的自适应工作流优化
中介引导的开源模型间多智能体协作用于医疗决策
看、听、记、思:具备长期记忆的多模态Agent
扩散型LLM可通过离散扩散强制实现快于自回归的推理
AWorld:具有稳定机动性的动态多Agent系统,用于鲁棒的GAIA问题求解
Story2Board:一种无需训练的富有表现力的分镜生成方法
替身:一种轻量级且即插即用的视频生成身份控制方法
Mol-R1:面向分子发现中显式长链思维推理
Llama-Nemotron:高效推理模型
Document Haystack:一个长上下文多模态图像/文档理解视觉LLM基准
Echo-4o:利用GPT-4o合成图像提升图像生成性能
无标记组织在成像质谱中的虚拟染色
VisCodex:通过融合视觉与编码模型实现统一的多模态代码生成
HierSearch:一种集成本地搜索与网络搜索的分层企业深度搜索框架
时间是一种特征:在扩散语言模型中利用时间动态特性
CharacterShot:可控且一致的4D角色动画
超越十轮:基于大规模异步强化学习的长周期智能体搜索
Matrix-3D:全向可探索的3D世界生成
WebWatcher:开拓视觉-语言深度研究Agent的新疆界
Marco-Voice 技术报告
Kimina-Prover 预览:基于强化学习的大型形式化推理模型探索
PyVeritas:基于LLM的转译与C语言的有界模型检测的Python验证
内在记忆智能体:通过结构化上下文记忆实现的异构多智能体LLM系统
通过建模CRISPR–Cas序列设计高功能基因组编辑器
UserBench:面向以用户为中心的Agent的交互式Gym环境
SONAR-LLM:一种在句子嵌入中思考并在token中表达的自回归Transformer
Klear-Reasoner:通过梯度保真裁剪策略优化提升推理能力
全效应:统一且空间可控制的视觉效果生成
WideSearch:面向智能体的广域信息搜索基准测试
ReasonRank:通过强大的推理能力赋能段落排序
AdaptFlow:基于元学习的自适应工作流优化
中介引导的开源模型间多智能体协作用于医疗决策