Command Palette
Search for a command to run...
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

基于正则化分数蒸馏采样的 3D 高斯点云中鲁棒的 3D 掩码部分级编辑

WebShaper:通过信息寻求进行数据合成的Agent化形式化































基于正则化分数蒸馏采样的 3D 高斯点云中鲁棒的 3D 掩码部分级编辑

WebShaper:通过信息寻求进行数据合成的Agent化形式化






























无形的牵引:为何RLVR可能无法摆脱其起源
GUI-G^2:用于 GUI 定位的高斯奖励建模
MiroMind-M1:通过上下文感知多阶段策略优化在数学推理领域的开源进展
内在无序区域结合蛋白的设计
全原子生成模型用于设计蛋白质复合物
RedOne:揭示社交网络服务中的领域特定LLM后训练
CSD-VAR:视觉自回归模型中的内容-风格分解
Mono-InternVL-1.5:迈向更经济、更快捷的单片多模态大语言模型
弗兰卡:嵌套马特里欧什卡聚类用于可扩展的视觉表示学习
一种以数据为中心的框架,用于解决俄语语音生成模型中的音位和韵律挑战
戴上面具的恶魔:扩散型LLM的安全漏洞问题
PrefPalette:基于潜在属性的个性化偏好建模
CUDA-L1:通过对比强化学习提升CUDA优化
AnyCap 项目:可控全模态标题生成的统一框架、数据集和基准测试
Diffuman4D:基于稀疏视角视频和时空扩散模型的4D一致人体视图合成
《模仿游戏:图灵机模仿者是长度泛化的推理者》
π^3: 可扩展的置换等变视觉几何学习
VisionThink:通过强化学习实现智能高效的视觉语言模型
大型语言模型上下文工程综述
评估机器中适应性世界模型的新游戏方法
基于LLM的情感支持对话生成
DrafterBench:评估大型语言模型在土木工程任务自动化中的表现
SWE-Perf:语言模型能否优化现实仓库中的代码性能?
MOSPA:由空间音频驱动的人类运动生成
MMHU:大规模多模态人类行为理解基准测试
PhysX:基于物理的3D资产生成
面向代理的 RAG 与深度推理:LLMs 中 RAG 推理系统的综述
La-Proteina:通过部分潜在流匹配生成原子级蛋白质
SUICA:学习用于空间转录组学的超高维稀疏隐式神经表示
XiChen:一个具有 4D 变分知识的可扩展观测的全 AI 驱动全球天气预报系统
无形的牵引:为何RLVR可能无法摆脱其起源
GUI-G^2:用于 GUI 定位的高斯奖励建模
MiroMind-M1:通过上下文感知多阶段策略优化在数学推理领域的开源进展
内在无序区域结合蛋白的设计
全原子生成模型用于设计蛋白质复合物
RedOne:揭示社交网络服务中的领域特定LLM后训练
CSD-VAR:视觉自回归模型中的内容-风格分解
Mono-InternVL-1.5:迈向更经济、更快捷的单片多模态大语言模型
弗兰卡:嵌套马特里欧什卡聚类用于可扩展的视觉表示学习
一种以数据为中心的框架,用于解决俄语语音生成模型中的音位和韵律挑战
戴上面具的恶魔:扩散型LLM的安全漏洞问题
PrefPalette:基于潜在属性的个性化偏好建模
CUDA-L1:通过对比强化学习提升CUDA优化
AnyCap 项目:可控全模态标题生成的统一框架、数据集和基准测试
Diffuman4D:基于稀疏视角视频和时空扩散模型的4D一致人体视图合成
《模仿游戏:图灵机模仿者是长度泛化的推理者》
π^3: 可扩展的置换等变视觉几何学习
VisionThink:通过强化学习实现智能高效的视觉语言模型
大型语言模型上下文工程综述
评估机器中适应性世界模型的新游戏方法
基于LLM的情感支持对话生成
DrafterBench:评估大型语言模型在土木工程任务自动化中的表现
SWE-Perf:语言模型能否优化现实仓库中的代码性能?
MOSPA:由空间音频驱动的人类运动生成
MMHU:大规模多模态人类行为理解基准测试
PhysX:基于物理的3D资产生成
面向代理的 RAG 与深度推理:LLMs 中 RAG 推理系统的综述
La-Proteina:通过部分潜在流匹配生成原子级蛋白质
SUICA:学习用于空间转录组学的超高维稀疏隐式神经表示
XiChen:一个具有 4D 变分知识的可扩展观测的全 AI 驱动全球天气预报系统