Command Palette
Search for a command to run...
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

多路思维:通过逐token分支与合并进行推理

推理模型催生“思想百家”































多路思维:通过逐token分支与合并进行推理

推理模型催生“思想百家”






























大规模多Agent AI系统发展与问题研究
ACoT-VLA:面向视觉-语言-动作模型的动作思维链
个性化误导之困:理解并缓解个性化LLM中的幻觉问题
RubricHub:通过自动化粗粒度到细粒度生成的全面且高区分度的评分标准数据集
解锁隐性经验:从文本中合成工具使用轨迹
毒苹果效应:通过AI Agent的技术扩展对中介市场实施策略性操纵
你的组相对优势存在偏差
STEM:通过嵌入模块扩展Transformer
迷失在噪声中:推理模型在上下文干扰项下的失效机制
超越静态工具:面向科学推理的测试时工具演化
VIBE:基于视觉指令的编辑器
协作式多Agent测试时强化学习用于推理
奖励稀有:面向LLM创造性问题求解的感知独特性强化学习
基于视觉-语言推理的城市社会语义分割
STEP3-VL-10B 技术报告
SeedFold:扩展生物分子结构预测
TranslateGemma 技术报告
Fast-ThinkAct:通过可表述的潜在规划实现高效的视觉-语言-动作推理
SkinFlow:通过动态视觉编码与分阶段强化学习实现开放性皮肤病诊断的高效信息传输
A^3-Bench:通过锚点与吸引子激活进行内存驱动型科学推理的基准测试
算法代码优化的受控自演化
MAXS:基于LLM Agent的元自适应探索
DeepResearchEval:一种用于深度研究任务构建与代理评估的自动化框架
0型映射到旗流形空间的动机类
UniversalRAG:面向多模态与多粒度语料库的检索增强生成
对齐文本、代码与视觉:一种用于文本到可视化生成的多目标强化学习框架
大语言模型在持续预训练过程中如何学习概念?
JudgeRLVR:先判断,后生成,实现高效推理
SnapGen++:释放扩散Transformer在边缘设备上高效高保真图像生成的潜力
视频生成中的运动归因
大规模多Agent AI系统发展与问题研究
ACoT-VLA:面向视觉-语言-动作模型的动作思维链
个性化误导之困:理解并缓解个性化LLM中的幻觉问题
RubricHub:通过自动化粗粒度到细粒度生成的全面且高区分度的评分标准数据集
解锁隐性经验:从文本中合成工具使用轨迹
毒苹果效应:通过AI Agent的技术扩展对中介市场实施策略性操纵
你的组相对优势存在偏差
STEM:通过嵌入模块扩展Transformer
迷失在噪声中:推理模型在上下文干扰项下的失效机制
超越静态工具:面向科学推理的测试时工具演化
VIBE:基于视觉指令的编辑器
协作式多Agent测试时强化学习用于推理
奖励稀有:面向LLM创造性问题求解的感知独特性强化学习
基于视觉-语言推理的城市社会语义分割
STEP3-VL-10B 技术报告
SeedFold:扩展生物分子结构预测
TranslateGemma 技术报告
Fast-ThinkAct:通过可表述的潜在规划实现高效的视觉-语言-动作推理
SkinFlow:通过动态视觉编码与分阶段强化学习实现开放性皮肤病诊断的高效信息传输
A^3-Bench:通过锚点与吸引子激活进行内存驱动型科学推理的基准测试
算法代码优化的受控自演化
MAXS:基于LLM Agent的元自适应探索
DeepResearchEval:一种用于深度研究任务构建与代理评估的自动化框架
0型映射到旗流形空间的动机类
UniversalRAG:面向多模态与多粒度语料库的检索增强生成
对齐文本、代码与视觉:一种用于文本到可视化生成的多目标强化学习框架
大语言模型在持续预训练过程中如何学习概念?
JudgeRLVR:先判断,后生成,实现高效推理
SnapGen++:释放扩散Transformer在边缘设备上高效高保真图像生成的潜力
视频生成中的运动归因