Command Palette
Search for a command to run...
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

TOPReward:作为机器人学中隐藏零样本奖励的Token概率

ManCAR:基于流形约束的潜在推理与自适应测试时计算的序列推荐































TOPReward:作为机器人学中隐藏零样本奖励的Token概率

ManCAR:基于流形约束的潜在推理与自适应测试时计算的序列推荐






























VLANeXt:构建强大VLA模型的配方
一个超大规模视频推理套件
基于视觉信息增益的大规模视觉语言模型选择性训练
DeepVision-103K:一个视觉多样、覆盖广泛且可验证的多模态推理数学数据集
SARAH:面向空间感知的实时智能体人类
EgoPush:面向移动机器人的端到端第一人称多物体重排学习
生成现实:基于手部与相机控制的交互式视频生成的人本世界模拟
VESPO:用于稳定离策略LLM训练的变分序列级软策略优化
阿斯翠三一大型技术报告
前沿人工智能风险管理体系实践:风险分析技术报告 v1.5
统一潜在表示(Unified Latents, UL):如何训练你的潜在表示
Mobile-Agent-v3.5:多平台基础GUI Agent
SpargeAttention2:通过混合Top-k+Top-p掩码与蒸馏微调实现可训练的稀疏注意力
AutoWebWorld:通过有限状态机合成无限可验证的Web环境
无界客户端-服务器系统的有界模型检测
检索增强模型相较于LLM在推理方面带来了多少提升?面向混合知识的多跳推理基准测试框架
视觉虫洞:异构多Agent系统中的潜在空间通信
帕尼尼:通过结构化记忆实现令牌空间中的持续学习
ResearchGym:在真实世界AI研究中评估语言模型代理
学习配置智能体AI系统
人工智能代理社会中的社会化现象是否涌现?——Moltbook案例研究
稀疏自编码器的合理性检验:SAE 是否优于随机基线?
SkillsBench:跨多样化任务评估Agent技能的有效性
GLM-5:从Vibe Coding到Agentic Engineering
字节跳动:基于二进制标记的自回归生成模型扩展
REDSearcher:一种可扩展且成本高效的长时序搜索Agent框架
Qute:面向量子原生数据库
InnoEval:将研究创意评估视为一种基于知识的多视角推理问题
查询作为锚点:基于大语言模型的场景自适应用户表征
SemanticMoments:通过三阶矩特征实现无需训练的动作相似性计算
VLANeXt:构建强大VLA模型的配方
一个超大规模视频推理套件
基于视觉信息增益的大规模视觉语言模型选择性训练
DeepVision-103K:一个视觉多样、覆盖广泛且可验证的多模态推理数学数据集
SARAH:面向空间感知的实时智能体人类
EgoPush:面向移动机器人的端到端第一人称多物体重排学习
生成现实:基于手部与相机控制的交互式视频生成的人本世界模拟
VESPO:用于稳定离策略LLM训练的变分序列级软策略优化
阿斯翠三一大型技术报告
前沿人工智能风险管理体系实践:风险分析技术报告 v1.5
统一潜在表示(Unified Latents, UL):如何训练你的潜在表示
Mobile-Agent-v3.5:多平台基础GUI Agent
SpargeAttention2:通过混合Top-k+Top-p掩码与蒸馏微调实现可训练的稀疏注意力
AutoWebWorld:通过有限状态机合成无限可验证的Web环境
无界客户端-服务器系统的有界模型检测
检索增强模型相较于LLM在推理方面带来了多少提升?面向混合知识的多跳推理基准测试框架
视觉虫洞:异构多Agent系统中的潜在空间通信
帕尼尼:通过结构化记忆实现令牌空间中的持续学习
ResearchGym:在真实世界AI研究中评估语言模型代理
学习配置智能体AI系统
人工智能代理社会中的社会化现象是否涌现?——Moltbook案例研究
稀疏自编码器的合理性检验:SAE 是否优于随机基线?
SkillsBench:跨多样化任务评估Agent技能的有效性
GLM-5:从Vibe Coding到Agentic Engineering
字节跳动:基于二进制标记的自回归生成模型扩展
REDSearcher:一种可扩展且成本高效的长时序搜索Agent框架
Qute:面向量子原生数据库
InnoEval:将研究创意评估视为一种基于知识的多视角推理问题
查询作为锚点:基于大语言模型的场景自适应用户表征
SemanticMoments:通过三阶矩特征实现无需训练的动作相似性计算