HyperAI超神经

PerceptionDLM：基于多模态扩散语言模型的并行区域感知

扩散模型

图像描述

Yueyi Sun, Yuhao Wang, Jason Li, et al.

用于通用游戏玩的代码世界模型

LLM

代码生成

Wolfgang Lehrach, Daniel Hennes, Miguel Lázaro-Gredilla, et al.

基准

Agent

Dhaval C. Patel, Kaoutar El Maghraoui, Shuxin Lin, et al.

Agent

视频理解

Yalun Dai, Hao Li, Shulin Tian, et al.

代码生成

LLM

Maria Ivanova, Pavel Zadorozhny, Rodion Levichev, et al.

Agent

代码生成

Junyi Zhang, Jiaxin Ge, Hanjun Yoo, et al.

Tianshan Zhang, Yijia Duan, Yanjun Li, et al.

图像修复

扩散模型

Kangsheng Duan, Ziyang Xu, Wenyu Liu, et al.

强化学习

LLM

Minseo Kim, Minjae Lee, Seunghyuk Oh, et al.

多模态

Jingyuan Huang, Zuming Huang, Yucheng Shi, et al.

多模态

机器视觉 3D

Yatai Ji, An-Chieh Cheng, Yang Fu, et al.

LLM

深度学习

Mingyue Cui, Linghui Shen, Xingyi Yang

Agent

多模态

Kairos Team, Fei Wang, Shan You, et al.

具身智能

Agent

Haowen Liu, Xirui Li, Shaoxiong Yao, et al.

多模态

LLM

Shengyuan Ding, Xilin Wei, Xinyu Fang, et al.

基准

LLM

Amelia Liu, Andrew Ho, Anne Marie Droste, et al.

TRIAGE：基于辩证推理的可解释风险预测——针对不规则采样医学时间序列结合大语言模型

LLM

模型训练

Hyeongwon Jang, Gyouk Chu, Changhun Kim, et al.

Agent

具身智能

Jaward Sesay, Yue Yu, Siwei Dong, et al.

代码生成

Agent

Tongxu Luo, Rongsheng Wang, Jiaxi Bi, et al.

强化学习

LLM

Byung-Kwan Lee, Ximing Lu, Shizhe Diao, et al.

多模态

监督式微调

Hao Li, Ganlong Zhao, Yufei Liu, et al.

Transformer

代码生成

Jian Yang, Shawn Guo, Wei Zhang, et al.

LLM

文本生成

Marcus Williams, Hannah Sheahan, Cameron Raymond, et al.

LLM

代码生成

Shaoqiu Zhang, Maoquan Wang, Yuling Shi, et al.

推理

监督式微调

Sen Xu, Shixi Liu, Wei Wang, et al.

扩散模型

文生视频

DreamX Team, Yancheng Bai, Rui Chen, et al.

多模态

多模态表征

Jisang Han, Seonghu Jeon, Jaewoo Jung, et al.

多模态

LLM

Kevin Qinghong Lin, Batu EI, Yuhong Shi, et al.

多模态

视频理解

Dingyu Yao, Junhao Zhou, Chenxu Yang, et al.

语音生成

深度估计

扩散模型

Hongfei Zhang, Harold Haodong Chen, Chenfei Liao, et al.

深度学习

AI for Science

Tianao Li, Emma Alexander

PerceptionDLM：基于多模态扩散语言模型的并行区域感知

扩散模型

图像描述

Yueyi Sun, Yuhao Wang, Jason Li, et al.

用于通用游戏玩的代码世界模型

LLM

代码生成

Wolfgang Lehrach, Daniel Hennes, Miguel Lázaro-Gredilla, et al.

基准

Agent

Dhaval C. Patel, Kaoutar El Maghraoui, Shuxin Lin, et al.

Agent

视频理解

Yalun Dai, Hao Li, Shulin Tian, et al.

代码生成

LLM

Maria Ivanova, Pavel Zadorozhny, Rodion Levichev, et al.

Agent

代码生成

Junyi Zhang, Jiaxin Ge, Hanjun Yoo, et al.

Tianshan Zhang, Yijia Duan, Yanjun Li, et al.

图像修复

扩散模型

Kangsheng Duan, Ziyang Xu, Wenyu Liu, et al.

强化学习

LLM

Minseo Kim, Minjae Lee, Seunghyuk Oh, et al.

多模态

Jingyuan Huang, Zuming Huang, Yucheng Shi, et al.

多模态

机器视觉 3D

Yatai Ji, An-Chieh Cheng, Yang Fu, et al.

LLM

深度学习

Mingyue Cui, Linghui Shen, Xingyi Yang

Agent

多模态

Kairos Team, Fei Wang, Shan You, et al.

具身智能

Agent

Haowen Liu, Xirui Li, Shaoxiong Yao, et al.

多模态

LLM

Shengyuan Ding, Xilin Wei, Xinyu Fang, et al.

基准

LLM

Amelia Liu, Andrew Ho, Anne Marie Droste, et al.

LLM

模型训练

Hyeongwon Jang, Gyouk Chu, Changhun Kim, et al.

Agent

具身智能

Jaward Sesay, Yue Yu, Siwei Dong, et al.

代码生成

Agent

Tongxu Luo, Rongsheng Wang, Jiaxi Bi, et al.

强化学习

LLM

Byung-Kwan Lee, Ximing Lu, Shizhe Diao, et al.

多模态

监督式微调

Hao Li, Ganlong Zhao, Yufei Liu, et al.

Transformer

代码生成

Jian Yang, Shawn Guo, Wei Zhang, et al.

LLM

文本生成

Marcus Williams, Hannah Sheahan, Cameron Raymond, et al.

LLM

代码生成

Shaoqiu Zhang, Maoquan Wang, Yuling Shi, et al.

推理

监督式微调

Sen Xu, Shixi Liu, Wei Wang, et al.

扩散模型

文生视频

DreamX Team, Yancheng Bai, Rui Chen, et al.

多模态

多模态表征

Jisang Han, Seonghu Jeon, Jaewoo Jung, et al.

多模态

LLM

Kevin Qinghong Lin, Batu EI, Yuhong Shi, et al.

多模态

视频理解

Dingyu Yao, Junhao Zhou, Chenxu Yang, et al.

语音生成

深度估计

扩散模型

Hongfei Zhang, Harold Haodong Chen, Chenfei Liao, et al.

深度学习

AI for Science

Tianao Li, Emma Alexander

超越静态排行榜：用于评估 LLM Agents 的预测效度

S-Agent：空间工具使用激发空间智能推理

Multi-LCB：将LiveCodeBench扩展至多种编程语言

玩耍式智能体机器人学习

DragMesh-2：面向铰接物体的物理合理灵巧手-物交互

Moebius：具有10B级性能的0.2B轻量级图像修复框架

EfficientRollout：用于强化学习 rollout 的系统感知自投机解码

信任正确的教师：面向 GUI 定位的质量感知自蒸馏

强化空间视觉语言模型中的双路径推理

SAE 干预并不可靠：干预后抑制行为的恢复

Kairos：面向物理人工智能的原生世界模型栈

Guava：一种有效且通用的具身操作框架

超越当前观测：在可控非马尔可夫博弈中评估多模态大语言模型

LifeSciBench：在生命科学的真实、专家级任务中评估语言模型

TRIAGE：基于辩证推理的可解释风险预测——针对不规则采样医学时间序列结合大语言模型

LectūraAgents：一种用于自适应个性化 AI 辅助学习与具身教学的多 Agent 框架

GameCraft-Bench：Agents能否在真实游戏引擎中端到端地构建可玩的游戏？

近端策略优化的最近发展区：提示中的教师，而非梯度

ACE-Ego-0：统一第一人称视角的人类与机器人数据用于VLA预训练

LoopCoder-v2：仅循环一次以实现高效的测试时计算扩展

通过模拟部署预测大语言模型发布前的安全性

FastContext：训练面向 Coding Agents 的高效仓库探索器

VibeThinker-3B：探索小型语言模型中可验证推理的前沿

DreamX-World 1.0：一种通用的交互式世界模型

用于机器人策略学习的几何动作模型

数据记者 Agent：将数据转化为可验证的多模态故事

JoyAI-VL-Interaction：实时视觉-语言交互智能

dots.tts 技术报告

基于生成先验的确定性视频深度估计

基于展开式 Plug-and-Play ADMM 的弱引力透镜星系图像解卷积

超越静态排行榜：用于评估 LLM Agents 的预测效度

S-Agent：空间工具使用激发空间智能推理

Multi-LCB：将LiveCodeBench扩展至多种编程语言

玩耍式智能体机器人学习

DragMesh-2：面向铰接物体的物理合理灵巧手-物交互

Moebius：具有10B级性能的0.2B轻量级图像修复框架

EfficientRollout：用于强化学习 rollout 的系统感知自投机解码

信任正确的教师：面向 GUI 定位的质量感知自蒸馏

强化空间视觉语言模型中的双路径推理

SAE 干预并不可靠：干预后抑制行为的恢复

Kairos：面向物理人工智能的原生世界模型栈

Guava：一种有效且通用的具身操作框架

超越当前观测：在可控非马尔可夫博弈中评估多模态大语言模型

LifeSciBench：在生命科学的真实、专家级任务中评估语言模型

TRIAGE：基于辩证推理的可解释风险预测——针对不规则采样医学时间序列结合大语言模型

LectūraAgents：一种用于自适应个性化 AI 辅助学习与具身教学的多 Agent 框架

GameCraft-Bench：Agents能否在真实游戏引擎中端到端地构建可玩的游戏？

近端策略优化的最近发展区：提示中的教师，而非梯度

ACE-Ego-0：统一第一人称视角的人类与机器人数据用于VLA预训练

LoopCoder-v2：仅循环一次以实现高效的测试时计算扩展

通过模拟部署预测大语言模型发布前的安全性

FastContext：训练面向 Coding Agents 的高效仓库探索器

VibeThinker-3B：探索小型语言模型中可验证推理的前沿

DreamX-World 1.0：一种通用的交互式世界模型

用于机器人策略学习的几何动作模型

数据记者 Agent：将数据转化为可验证的多模态故事

JoyAI-VL-Interaction：实时视觉-语言交互智能

dots.tts 技术报告

基于生成先验的确定性视频深度估计

基于展开式 Plug-and-Play ADMM 的弱引力透镜星系图像解卷积

Command Palette

论文

Command Palette

论文

Command Palette

论文