Command Palette
Search for a command to run...
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

VoxHammer:无需训练的原生3D空间中精确且连贯的3D编辑

CMPhysBench:用于评估大语言模型在凝聚态物理领域性能的基准测试































VoxHammer:无需训练的原生3D空间中精确且连贯的3D编辑

CMPhysBench:用于评估大语言模型在凝聚态物理领域性能的基准测试






























TreePO:基于启发式树建模弥合策略优化与有效性及推理效率之间的差距
Nemotron-CC-Math:一个1330亿token规模的高质量数学预训练数据集
理解工具集成推理
Spacer:面向工程化科学灵感
超越记忆:通过循环、记忆与测试时计算扩展实现推理深度延伸
VibeVoice 技术报告
MMTok:面向视觉语言模型高效推理的多模态覆盖最大化
MV-RAG:检索增强的多视角扩散模型
利用多模态机器学习将金属有机框架合成与应用相连接
自适应传输系统中的模型上下文协议:一项综述
多集体的算法集体行动
OpenCUA:面向计算机使用智能体的开源基础
空间策略:基于空间感知建模与推理引导视觉-运动机器人操作
Jet-Nemotron:基于后神经架构搜索的高效语言模型
CRISP:通过稀疏自编码器实现的持久概念遗忘
弱监督可操作性定位中的选择性对比学习
EgoTwin:第一人称视角下的身体与视图梦境
超越Pass@1:基于变分问题生成的自对弈持续提升RLVR
ODYSSEY:面向长时程任务的开放世界四足动物探索与操作
AgentFly:在不微调LLM的情况下微调LLM Agent
约束引导的扩散推理器用于神经符号学习
基于LLM的智能体在药物资产尽职调查中的竞争格局映射
SceneGen:单图像3D场景生成的一次前向传播
大语言模型基准测试综述
Waver:以波形之姿实现逼真视频生成
LiveMCP-101:在复杂查询上对MCP增强型Agent进行压力测试与诊断
自信地深度思考
Mobile-Agent-v3:GUI自动化的基础智能体
Intern-S1:一种科学多模态基础模型
语言引导微调:利用文本反馈增强数值优化
TreePO:基于启发式树建模弥合策略优化与有效性及推理效率之间的差距
Nemotron-CC-Math:一个1330亿token规模的高质量数学预训练数据集
理解工具集成推理
Spacer:面向工程化科学灵感
超越记忆:通过循环、记忆与测试时计算扩展实现推理深度延伸
VibeVoice 技术报告
MMTok:面向视觉语言模型高效推理的多模态覆盖最大化
MV-RAG:检索增强的多视角扩散模型
利用多模态机器学习将金属有机框架合成与应用相连接
自适应传输系统中的模型上下文协议:一项综述
多集体的算法集体行动
OpenCUA:面向计算机使用智能体的开源基础
空间策略:基于空间感知建模与推理引导视觉-运动机器人操作
Jet-Nemotron:基于后神经架构搜索的高效语言模型
CRISP:通过稀疏自编码器实现的持久概念遗忘
弱监督可操作性定位中的选择性对比学习
EgoTwin:第一人称视角下的身体与视图梦境
超越Pass@1:基于变分问题生成的自对弈持续提升RLVR
ODYSSEY:面向长时程任务的开放世界四足动物探索与操作
AgentFly:在不微调LLM的情况下微调LLM Agent
约束引导的扩散推理器用于神经符号学习
基于LLM的智能体在药物资产尽职调查中的竞争格局映射
SceneGen:单图像3D场景生成的一次前向传播
大语言模型基准测试综述
Waver:以波形之姿实现逼真视频生成
LiveMCP-101:在复杂查询上对MCP增强型Agent进行压力测试与诊断
自信地深度思考
Mobile-Agent-v3:GUI自动化的基础智能体
Intern-S1:一种科学多模态基础模型
语言引导微调:利用文本反馈增强数值优化