HyperAI超神经

AgentVista：在超具挑战性的真实视觉场景中评估多模态 Agent

多模态

Agent

Zhaochen Su, Jincheng Gao, Hangyu Guo, et al.

DARE：通过分布感知检索将LLM Agents与R统计生态系统对齐

检索增强生成

代码生成

Maojun Sun, Yue Wu, Yifei Xie, et al.

Agent

LLM

Yuan Liang, Ruobin Zhong, Haoming Xu, et al.

AI for Science

LLM

Zonglin Yang, Lidong Bing

基准

Shahrriar Noroozizadeh, Xiaobin Shen, Jeremy C. Weiss, et al.

PanoWan：通过经纬度感知机制将 Diffusion 视频生成模型提升至 360° 全景维度

扩散模型

文生视频

Yifei Xia, Shuchen Weng, Siqi Yang, et al.

ArtHOI：基于视频先验的 4D 重建生成可 Articulated 的人 - 物交互

3D 生成

视频生成

Zihao Huang, Tianqi Liu, Zhaoxi Chen, et al.

视频理解

多模态

Weicai Yan, Yuhong Dai, Qi Ran, et al.

文档理解

LLM

Qinsi Wang, Hancheng Ye, Jinhee Kim, et al.

强化学习

Agent

Zhixia Zhang, Zixuan Huang, Xin Xia, et al.

视频生成

文生视频

Shenghai Yuan, Yuanyang Yin, Zongjian Li, et al.

基准

Mark Goadrich, Achille Morenville, Éric Piette

LLM

文本生成

Tanishq Kumar, Tri Dao, Avner May

AI for Science

LLM

Xin Xia, Nejla Yuruk, Yun Wang, et al.

机器人技术

具身智能

Xiaomeng Xu, Jisang Park, Han Zhang, et al.

LLM

偏好

Patrick Gerard, Svitlana Volkova

Gravity Falls：移动设备鱼叉式网络钓鱼的域名生成算法（DGA）检测方法比较分析

Adam Dorian Wong, John D. Hastings

Marc Finzi, Shikai Qiu, Yiding Jiang, et al.

扩散模型

多模态

Louis Bethune, Victor Turrisi, Bruno Kacper Mlodozeniec, et al.

LLM

推理

Xinyu Zhu, Yihao Feng, Yanchao Sun, et al.

基准

LLM

Qiyuan Zhang, Junyi Zhou, Yufei Wang, et al.

多模态

推理

Jiachun Li, Shaoping Huang, Zhuoran Jin, et al.

自然语言处理

LLM

Grigory Arshinov, Aleksandr Boriskin, Sergey Senichev, et al.

多模态

视频生成

Yiying Yang, Wei Cheng, Sijin Chen, et al.

图像生成

图生图

Xiangyan Qu, Zhenlong Yuan, Jing Tang, et al.

强化学习

Agent

Marissa A. Weis, Maciej Wołczyk, Rajai Nasser, et al.

Agent

LLM

Hongbin Zhong, Fazole Faisalal, Luis França, et al.

检索增强生成

基准

Zhengqing Yuan, Kaiwen Shi, Zheyuan Zhang, et al.

视频生成

扩散模型

Shengqu Cai, Weili Nie, Chao Liu, et al.

AI 编译器

代码生成

Weinan Dai, Hanlin Wu, Qiying Yu, et al.

翻译

LLM

Hanna Yukhymenko, Anton Alexandrov, Martin Vechev

图像生成

文生图

Zhenyu Tang, Chaoran Feng, Yufan Deng, et al.

AgentVista：在超具挑战性的真实视觉场景中评估多模态 Agent

多模态

Agent

Zhaochen Su, Jincheng Gao, Hangyu Guo, et al.

DARE：通过分布感知检索将LLM Agents与R统计生态系统对齐

检索增强生成

代码生成

Maojun Sun, Yue Wu, Yifei Xie, et al.

Agent

LLM

Yuan Liang, Ruobin Zhong, Haoming Xu, et al.

AI for Science

LLM

Zonglin Yang, Lidong Bing

基准

Shahrriar Noroozizadeh, Xiaobin Shen, Jeremy C. Weiss, et al.

扩散模型

文生视频

Yifei Xia, Shuchen Weng, Siqi Yang, et al.

3D 生成

视频生成

Zihao Huang, Tianqi Liu, Zhaoxi Chen, et al.

视频理解

多模态

Weicai Yan, Yuhong Dai, Qi Ran, et al.

文档理解

LLM

Qinsi Wang, Hancheng Ye, Jinhee Kim, et al.

强化学习

Agent

Zhixia Zhang, Zixuan Huang, Xin Xia, et al.

视频生成

文生视频

Shenghai Yuan, Yuanyang Yin, Zongjian Li, et al.

基准

Mark Goadrich, Achille Morenville, Éric Piette

LLM

文本生成

Tanishq Kumar, Tri Dao, Avner May

AI for Science

LLM

Xin Xia, Nejla Yuruk, Yun Wang, et al.

机器人技术

具身智能

Xiaomeng Xu, Jisang Park, Han Zhang, et al.

LLM

偏好

Patrick Gerard, Svitlana Volkova

Adam Dorian Wong, John D. Hastings

Marc Finzi, Shikai Qiu, Yiding Jiang, et al.

扩散模型

多模态

Louis Bethune, Victor Turrisi, Bruno Kacper Mlodozeniec, et al.

LLM

推理

Xinyu Zhu, Yihao Feng, Yanchao Sun, et al.

基准

LLM

Qiyuan Zhang, Junyi Zhou, Yufei Wang, et al.

多模态

推理

Jiachun Li, Shaoping Huang, Zhuoran Jin, et al.

自然语言处理

LLM

Grigory Arshinov, Aleksandr Boriskin, Sergey Senichev, et al.

多模态

视频生成

Yiying Yang, Wei Cheng, Sijin Chen, et al.

图像生成

图生图

Xiangyan Qu, Zhenlong Yuan, Jing Tang, et al.

强化学习

Agent

Marissa A. Weis, Maciej Wołczyk, Rajai Nasser, et al.

Agent

LLM

Hongbin Zhong, Fazole Faisalal, Luis França, et al.

检索增强生成

基准

Zhengqing Yuan, Kaiwen Shi, Zheyuan Zhang, et al.

视频生成

扩散模型

Shengqu Cai, Weili Nie, Chao Liu, et al.

AI 编译器

代码生成

Weinan Dai, Hanlin Wu, Qiying Yu, et al.

翻译

LLM

Hanna Yukhymenko, Anton Alexandrov, Martin Vechev

图像生成

文生图

Zhenyu Tang, Chaoran Feng, Yufan Deng, et al.

SkillNet：构建、评估与连接 AI 技能

MOOSE-Star：打破复杂性壁垒，开启科学发现的可行训练新范式

SURvHTE-Bench：生存分析中异质性治疗效应估计的基准测试

PanoWan：通过经纬度感知机制将 Diffusion 视频生成模型提升至 360° 全景维度

ArtHOI：基于视频先验的 4D 重建生成可 Articulated 的人 - 物交互

Proact-VL：面向实时 AI 伴侣的主动式 VideoLLM

T2S-Bench 与思维结构：综合文本到结构推理的基准测试与提示方法

异构智能体协同强化学习

Helios：实时长视频生成模型

Valet：传统不完全信息卡牌游戏的标准化测试平台

推测性解码

利用学习进阶指导科学学习中的 AI 反馈

HoMMI：从人类示范中学习全身移动操作

密度引导的响应优化：基于隐含接受信号的社群对齐

Gravity Falls：移动设备鱼叉式网络钓鱼的域名生成算法（DGA）检测方法比较分析

从熵到复杂性（Epiplexity）：重新审视计算受限智能中的信息论视角

三模态 Masked Diffusion Models 的设计空间

CHIMERA：用于可泛化LLM推理的紧凑型合成数据

RubricBench：使模型生成的评分标准与人类标准对齐

MMR-Life：为多模态多图像推理拼合真实场景

OpenAutoNLU：面向自然语言理解的开源AutoML库

OmniLottie：通过参数化 Lottie Tokens 生成矢量动画

从规模到速度：面向图像编辑的自适应测试时缩放

通过上下文共玩家推理实现 Multi-agent 协作

ACTIONENGINE：通过状态机 Memory 实现从反应式到程序化 GUI Agent 的演进

CiteAudit：你引用了它，但你读过吗？面向大语言模型时代的科学引用验证基准

模式寻找与均值寻找相结合实现快速长视频生成

CUDA Agent：面向高性能CUDA内核生成的大规模智能体强化学习

翻译复原：面向基准测试与数据集自动化翻译的高效流水线

通过奖励建模增强图像生成中的空间理解

SkillNet：构建、评估与连接 AI 技能

MOOSE-Star：打破复杂性壁垒，开启科学发现的可行训练新范式

SURvHTE-Bench：生存分析中异质性治疗效应估计的基准测试

PanoWan：通过经纬度感知机制将 Diffusion 视频生成模型提升至 360° 全景维度

ArtHOI：基于视频先验的 4D 重建生成可 Articulated 的人 - 物交互

Proact-VL：面向实时 AI 伴侣的主动式 VideoLLM

T2S-Bench 与思维结构：综合文本到结构推理的基准测试与提示方法

异构智能体协同强化学习

Helios：实时长视频生成模型

Valet：传统不完全信息卡牌游戏的标准化测试平台

推测性解码

利用学习进阶指导科学学习中的 AI 反馈

HoMMI：从人类示范中学习全身移动操作

密度引导的响应优化：基于隐含接受信号的社群对齐

Gravity Falls：移动设备鱼叉式网络钓鱼的域名生成算法（DGA）检测方法比较分析

从熵到复杂性（Epiplexity）：重新审视计算受限智能中的信息论视角

三模态 Masked Diffusion Models 的设计空间

CHIMERA：用于可泛化LLM推理的紧凑型合成数据

RubricBench：使模型生成的评分标准与人类标准对齐

MMR-Life：为多模态多图像推理拼合真实场景

OpenAutoNLU：面向自然语言理解的开源AutoML库

OmniLottie：通过参数化 Lottie Tokens 生成矢量动画

从规模到速度：面向图像编辑的自适应测试时缩放

通过上下文共玩家推理实现 Multi-agent 协作

ACTIONENGINE：通过状态机 Memory 实现从反应式到程序化 GUI Agent 的演进

CiteAudit：你引用了它，但你读过吗？面向大语言模型时代的科学引用验证基准

模式寻找与均值寻找相结合实现快速长视频生成

CUDA Agent：面向高性能CUDA内核生成的大规模智能体强化学习

翻译复原：面向基准测试与数据集自动化翻译的高效流水线

通过奖励建模增强图像生成中的空间理解

Command Palette

论文

Command Palette

论文

Command Palette

论文