Command Palette
Search for a command to run...
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

Think-at-Hard:通过选择性潜在迭代提升推理型语言模型

HumanSense:从多模态感知到通过推理实现共情的上下文感知响应的MLLMs































Think-at-Hard:通过选择性潜在迭代提升推理型语言模型

HumanSense:从多模态感知到通过推理实现共情的上下文感知响应的MLLMs






























CamCloneMaster:实现基于参考的相机控制用于视频生成
EditScore:通过高保真奖励建模解锁图像编辑中的在线RL
InteractMove:基于文本控制的3D场景中可移动物体的人-物交互生成
WebCoach:具有跨会话记忆引导的自演化Web Agent
信任的学习:在序列决策中对不同建议者可靠性进行贝叶斯自适应
GroupRank:一种由强化学习驱动的分组重排序范式
MMaDA-Parallel:面向思维感知编辑与生成的多模态大扩散语言模型
TiViBench:面向视频生成模型的视频思维推理基准测试
Part-X-MLLM:面向部件感知的3D多模态大语言模型
Uni-MoE-2.0-Omni:基于先进MoE、训练与数据的面向语言中心的全模态大模型扩展
P1:基于强化学习的物理奥林匹克竞赛攻关
Lancelot:面向高效且隐私保护的拜占庭鲁棒联邦学习的全同态加密框架
无需变分自编码器的潜在扩散模型
RewardMap:通过多阶段强化学习应对细粒度视觉推理中的稀疏奖励
ReinFlow:通过在线强化学习微调流匹配策略
推理能力的语音评估:诊断模态诱导的性能差距
MarsRL:通过代理流水线并行化的强化学习推进多Agent推理系统
虚拟宽度网络
AIonopedia:一个由 LLM Agent 驱动的多模态学习系统,用于离子液体的发现
UI2CodeN:一种支持测试时可扩展的交互式UI到代码生成的视觉语言模型
GGBench:面向统一多模态模型的几何生成推理基准
WEAVE:释放并基准测试上下文交错理解与生成能力
DoPE:去噪旋转位置嵌入
BRFL:一种基于区块链的拜占庭鲁棒联邦学习模型
基于指数-高斯混合网络的视频观看时长预测多粒度分布建模
SAC Flow:通过速度重参数化序列建模实现基于流策略的样本高效强化学习
针对闭源MLLM的对抗攻击通过特征最优对齐
Hail to the Thief:探索去中心化GRPO中的攻击与防御
大语言模型的黑盒策略蒸馏
UniVA:面向开源下一代视频通用智能体的通用视频代理
CamCloneMaster:实现基于参考的相机控制用于视频生成
EditScore:通过高保真奖励建模解锁图像编辑中的在线RL
InteractMove:基于文本控制的3D场景中可移动物体的人-物交互生成
WebCoach:具有跨会话记忆引导的自演化Web Agent
信任的学习:在序列决策中对不同建议者可靠性进行贝叶斯自适应
GroupRank:一种由强化学习驱动的分组重排序范式
MMaDA-Parallel:面向思维感知编辑与生成的多模态大扩散语言模型
TiViBench:面向视频生成模型的视频思维推理基准测试
Part-X-MLLM:面向部件感知的3D多模态大语言模型
Uni-MoE-2.0-Omni:基于先进MoE、训练与数据的面向语言中心的全模态大模型扩展
P1:基于强化学习的物理奥林匹克竞赛攻关
Lancelot:面向高效且隐私保护的拜占庭鲁棒联邦学习的全同态加密框架
无需变分自编码器的潜在扩散模型
RewardMap:通过多阶段强化学习应对细粒度视觉推理中的稀疏奖励
ReinFlow:通过在线强化学习微调流匹配策略
推理能力的语音评估:诊断模态诱导的性能差距
MarsRL:通过代理流水线并行化的强化学习推进多Agent推理系统
虚拟宽度网络
AIonopedia:一个由 LLM Agent 驱动的多模态学习系统,用于离子液体的发现
UI2CodeN:一种支持测试时可扩展的交互式UI到代码生成的视觉语言模型
GGBench:面向统一多模态模型的几何生成推理基准
WEAVE:释放并基准测试上下文交错理解与生成能力
DoPE:去噪旋转位置嵌入
BRFL:一种基于区块链的拜占庭鲁棒联邦学习模型
基于指数-高斯混合网络的视频观看时长预测多粒度分布建模
SAC Flow:通过速度重参数化序列建模实现基于流策略的样本高效强化学习
针对闭源MLLM的对抗攻击通过特征最优对齐
Hail to the Thief:探索去中心化GRPO中的攻击与防御
大语言模型的黑盒策略蒸馏
UniVA:面向开源下一代视频通用智能体的通用视频代理