Command Palette
Search for a command to run...
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

OmniWorld:用于4D世界建模的多领域多模态数据集

LAVa:基于层级的KV缓存淘汰与动态预算分配































OmniWorld:用于4D世界建模的多领域多模态数据集

LAVa:基于层级的KV缓存淘汰与动态预算分配






























基于概率结构融合的世界建模
VStyle:一个基于口语指令的语音风格适配基准
HANRAG:启发式高精度抗噪声多跳问答增强生成
InfGen:一种与分辨率无关的可扩展图像合成范式
X-Part:高保真且结构一致的形状分解
收益递减的错觉:LLM中长时 horizon 执行的度量
IntrEx:用于建模教育对话中参与度的数据集
Youtu-GraphRAG:面向图检索增强型复杂推理的垂直统一Agent
SceneSplat:基于视觉-语言预训练的高斯点云场景理解
虚拟 Agent 经济
视觉语言模型中视觉定位的理解研究
Kling-Avatar:用于级联长时长头像动画合成的多模态指令接地
机器学习LLM:在数百万个合成表格预测任务上持续预训练语言模型以实现上下文内机器学习
EchoX:通过回声训练缓解语音到语音LLM中的声学-语义鸿沟
SimpleVLA-RL:通过强化学习扩展VLA训练
VLA-Adapter:一种高效的小规模视觉-语言-动作模型范式
scSiameseClu:一种用于解释单细胞RNA测序数据的孪生聚类框架
ST-Raptor:基于LLM的半结构化表格问答
OmniSpatial:面向视觉语言模型的全面空间推理基准
理解谈判博弈中人类代理与AI代理之间的经济权衡
Jupiter:通过Notebook与推理时价值引导搜索增强LLM数据分析能力
Hunyuan-MT 技术报告
P3-SAM:原生3D部件分割
AgentGym-RL:通过多轮强化学习训练LLM Agent实现长时程决策
三维与四维世界建模:一项综述
RewardDance:视觉生成中的奖励缩放
分享即关爱:基于集体强化学习经验共享的高效LM后训练
FinReflectKG:金融知识图谱的智能体构建与评估
大规模推理模型的强化学习研究综述
衡量并缓解过度依赖对于构建与人类兼容的AI至关重要
基于概率结构融合的世界建模
VStyle:一个基于口语指令的语音风格适配基准
HANRAG:启发式高精度抗噪声多跳问答增强生成
InfGen:一种与分辨率无关的可扩展图像合成范式
X-Part:高保真且结构一致的形状分解
收益递减的错觉:LLM中长时 horizon 执行的度量
IntrEx:用于建模教育对话中参与度的数据集
Youtu-GraphRAG:面向图检索增强型复杂推理的垂直统一Agent
SceneSplat:基于视觉-语言预训练的高斯点云场景理解
虚拟 Agent 经济
视觉语言模型中视觉定位的理解研究
Kling-Avatar:用于级联长时长头像动画合成的多模态指令接地
机器学习LLM:在数百万个合成表格预测任务上持续预训练语言模型以实现上下文内机器学习
EchoX:通过回声训练缓解语音到语音LLM中的声学-语义鸿沟
SimpleVLA-RL:通过强化学习扩展VLA训练
VLA-Adapter:一种高效的小规模视觉-语言-动作模型范式
scSiameseClu:一种用于解释单细胞RNA测序数据的孪生聚类框架
ST-Raptor:基于LLM的半结构化表格问答
OmniSpatial:面向视觉语言模型的全面空间推理基准
理解谈判博弈中人类代理与AI代理之间的经济权衡
Jupiter:通过Notebook与推理时价值引导搜索增强LLM数据分析能力
Hunyuan-MT 技术报告
P3-SAM:原生3D部件分割
AgentGym-RL:通过多轮强化学习训练LLM Agent实现长时程决策
三维与四维世界建模:一项综述
RewardDance:视觉生成中的奖励缩放
分享即关爱:基于集体强化学习经验共享的高效LM后训练
FinReflectKG:金融知识图谱的智能体构建与评估
大规模推理模型的强化学习研究综述
衡量并缓解过度依赖对于构建与人类兼容的AI至关重要