Command Palette
Search for a command to run...
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

DeepAgent:具备可扩展工具集的通用推理Agent

不确定性感知的多目标强化学习引导的扩散模型用于三维从头分子设计





























DeepAgent:具备可扩展工具集的通用推理Agent

不确定性感知的多目标强化学习引导的扩散模型用于三维从头分子设计




























Reac-Discovery:一种由人工智能驱动的连续流催化反应器发现与优化平台
BoltzGen:迈向通用结合剂设计
HSCodeComp:面向层级规则应用中深度搜索Agent的现实且专家级基准
DyPE:用于超高分辨率扩散的动态位置外推
HoloCine:电影级多镜头长视频叙事的全局生成
Open-o3 Video:基于显式时空证据的视频推理
AdaSPEC:用于高效推测解码器的可选知识蒸馏
人类-Agent协同的论文到页面制作成本低于0.1美元
从Token化到视觉阅读
用于微调MLLMs的定向推理注入
语言模型是单射的,因此可逆
自由Transformer
基于机器学习的量子处理单元(QPU)处理时间预测
量子遍历性边缘的建设性干涉观测
VideoAgentTrek:从无标签视频中进行计算机使用预训练
GigaBrain-0:基于世界模型的视觉-语言-行动模型
LoongRL:面向长上下文的高级推理强化学习
BAPO:通过自适应裁剪的平衡策略优化稳定化LLM的离策略强化学习
每个Attention都至关重要:一种用于长上下文推理的高效混合架构
正确着色:连接感知色彩空间与文本嵌入以提升扩散生成效果
基于视觉-语言模型的自指多视角场景空间推理
LoFT:面向开放世界场景中长尾半监督学习的参数高效微调
FLOWER:通过高效的视觉-语言-动作流策略实现通用机器人策略的民主化
基于图像修复引导的扩散型大语言模型策略优化
MCP-AgentBench:通过MCP中介工具评估真实世界语言Agent性能
扩散模型中的缓存方法综述:面向高效多模态生成
重新思考驾驶世界模型作为感知任务的合成数据生成器
空间可变对焦
何时进行集成:识别用于稳定且快速LLM集成的token级点
面向通用检索增强生成的混合模态检索
Reac-Discovery:一种由人工智能驱动的连续流催化反应器发现与优化平台
BoltzGen:迈向通用结合剂设计
HSCodeComp:面向层级规则应用中深度搜索Agent的现实且专家级基准
DyPE:用于超高分辨率扩散的动态位置外推
HoloCine:电影级多镜头长视频叙事的全局生成
Open-o3 Video:基于显式时空证据的视频推理
AdaSPEC:用于高效推测解码器的可选知识蒸馏
人类-Agent协同的论文到页面制作成本低于0.1美元
从Token化到视觉阅读
用于微调MLLMs的定向推理注入
语言模型是单射的,因此可逆
自由Transformer
基于机器学习的量子处理单元(QPU)处理时间预测
量子遍历性边缘的建设性干涉观测
VideoAgentTrek:从无标签视频中进行计算机使用预训练
GigaBrain-0:基于世界模型的视觉-语言-行动模型
LoongRL:面向长上下文的高级推理强化学习
BAPO:通过自适应裁剪的平衡策略优化稳定化LLM的离策略强化学习
每个Attention都至关重要:一种用于长上下文推理的高效混合架构
正确着色:连接感知色彩空间与文本嵌入以提升扩散生成效果
基于视觉-语言模型的自指多视角场景空间推理
LoFT:面向开放世界场景中长尾半监督学习的参数高效微调
FLOWER:通过高效的视觉-语言-动作流策略实现通用机器人策略的民主化
基于图像修复引导的扩散型大语言模型策略优化
MCP-AgentBench:通过MCP中介工具评估真实世界语言Agent性能
扩散模型中的缓存方法综述:面向高效多模态生成
重新思考驾驶世界模型作为感知任务的合成数据生成器
空间可变对焦
何时进行集成:识别用于稳定且快速LLM集成的token级点
面向通用检索增强生成的混合模态检索