HyperAI超神经

SkillOpt：自我进化 Agent 技能的执行策略

Agent

LLM

Yifan Yang, Ziyang Gong, Weiquan Huang, et al.

CVEvolve：面向非结构化科学数据处理的自主算法发现

AI for Science

图像处理

Ming Du, Xiangyu Yin, Yanqi Luo, et al.

强化学习

LLM

Ifdita Hasan Orney, Jubayer Ibn Hamid, Shreya S Ramanujam, et al.

检索增强生成

LLM

Ryan Wei Heng Quek, Sanghyuk Lee, Alfred Wei Lun Leong, et al.

Agent

监督式微调

Qisheng Su, Zhen Fang, Shiting Huang, et al.

Transformer

LLM

Yanke Zhou, Yiduo Li, Hanlin Tang, et al.

Agent

基准

Haoran Zhang, Luxin Xu, Zhilin Wang, et al.

多模态

LLM

Caixin Kang, Tianyu Yan, Sitong Gong, et al.

LLM

交通

Hanyu Guo, Jiedong Yang, Chao Chen, et al.

强化学习

LLM

Kaiyi Zhang, Wei Wu, Yankai Lin

基准

LLM

Keyang Xuan, Peiyang Song, Pan Lu, et al.

具身智能

感知

Yining Hong, Jiageng Liu, Han Yin, et al.

目标检测

机器视觉

Sourov Roy Shuvo, Prajwal Panth, Rajesh Chowdhury, et al.

LLM

自然语言处理

Fernando Ortega, Raúl Lara-Cabrera, Jorge Dueñas-Lerín, et al.

文本生成

vLLM

Tiantian Ji, Pengfeng Lin, Miao Zhu, et al.

机器视觉 3D

感知

Rowan Border, Margarita Chli

模型训练

LLM

Yongkang Liu, Xing Li, Mengjie Zhao, et al.

深度学习

模型训练

Samuele Pasini, Jinhan Kim, Paolo Tonella

推理

LLM

Parshin Shojae, Iman Mirzadeh, Keivan Alizadeh, et al.

推理

文本生成

Junyeob Baek, Mingyu Jo, Minsu Kim, et al.

LLM

模型训练

Pratyush Maini, Sachin Goyal, Dylan Sam, et al.

强化学习

Agent

Gaotang Li, Bhavana Dalvi Mishra, Zifeng Wang, et al.

视频理解

多模态

Xiaofei Wen, Wenjie Jacky Mo, Xingyu Fu, et al.

Agent

AI for Science

Jiaqi Liu, Shi Qiu, Mairui Li, et al.

推理

强化学习

Jinyuan Li, Langlin Huang, Chengsong Huang, et al.

强化学习

LLM

Minxuan Lv, Tiehua Mei, Tanlong Du, et al.

Agent

LLM

Jinbiao Wei, Qianran Ma, Yilun Zhao, et al.

强化学习

推理

Guobin Shen, Xiang Cheng, Chenxiao Zhao, et al.

LLM

监督式微调

Sam Herring, Jake Naviasky, Karan Malhotra

扩散模型

文本生成

Zhihan Yang, Wei Guo, Shuibai Zhang, et al.

视频生成

文生视频

Ruicheng Zhang, Kaixi Cong, Jun Zhou, et al.

3D 生成

3D 模型

Yixuan Yang, Zhen Luo, Wanshui Gan, et al.

SkillOpt：自我进化 Agent 技能的执行策略

Agent

LLM

Yifan Yang, Ziyang Gong, Weiquan Huang, et al.

CVEvolve：面向非结构化科学数据处理的自主算法发现

AI for Science

图像处理

Ming Du, Xiangyu Yin, Yanqi Luo, et al.

强化学习

LLM

Ifdita Hasan Orney, Jubayer Ibn Hamid, Shreya S Ramanujam, et al.

检索增强生成

LLM

Ryan Wei Heng Quek, Sanghyuk Lee, Alfred Wei Lun Leong, et al.

Agent

监督式微调

Qisheng Su, Zhen Fang, Shiting Huang, et al.

Transformer

LLM

Yanke Zhou, Yiduo Li, Hanlin Tang, et al.

Agent

基准

Haoran Zhang, Luxin Xu, Zhilin Wang, et al.

多模态

LLM

Caixin Kang, Tianyu Yan, Sitong Gong, et al.

LLM

交通

Hanyu Guo, Jiedong Yang, Chao Chen, et al.

强化学习

LLM

Kaiyi Zhang, Wei Wu, Yankai Lin

基准

LLM

Keyang Xuan, Peiyang Song, Pan Lu, et al.

具身智能

感知

Yining Hong, Jiageng Liu, Han Yin, et al.

目标检测

机器视觉

Sourov Roy Shuvo, Prajwal Panth, Rajesh Chowdhury, et al.

LLM

自然语言处理

Fernando Ortega, Raúl Lara-Cabrera, Jorge Dueñas-Lerín, et al.

文本生成

vLLM

Tiantian Ji, Pengfeng Lin, Miao Zhu, et al.

机器视觉 3D

感知

Rowan Border, Margarita Chli

模型训练

LLM

Yongkang Liu, Xing Li, Mengjie Zhao, et al.

深度学习

模型训练

Samuele Pasini, Jinhan Kim, Paolo Tonella

推理

LLM

Parshin Shojae, Iman Mirzadeh, Keivan Alizadeh, et al.

推理

文本生成

Junyeob Baek, Mingyu Jo, Minsu Kim, et al.

LLM

模型训练

Pratyush Maini, Sachin Goyal, Dylan Sam, et al.

强化学习

Agent

Gaotang Li, Bhavana Dalvi Mishra, Zifeng Wang, et al.

视频理解

多模态

Xiaofei Wen, Wenjie Jacky Mo, Xingyu Fu, et al.

Agent

AI for Science

Jiaqi Liu, Shi Qiu, Mairui Li, et al.

推理

强化学习

Jinyuan Li, Langlin Huang, Chengsong Huang, et al.

强化学习

LLM

Minxuan Lv, Tiehua Mei, Tanlong Du, et al.

Agent

LLM

Jinbiao Wei, Qianran Ma, Yilun Zhao, et al.

强化学习

推理

Guobin Shen, Xiang Cheng, Chenxiao Zhao, et al.

LLM

监督式微调

Sam Herring, Jake Naviasky, Karan Malhotra

扩散模型

文本生成

Zhihan Yang, Wei Guo, Shuibai Zhang, et al.

视频生成

文生视频

Ruicheng Zhang, Kaixi Cong, Jun Zhou, et al.

3D 生成

3D 模型

Yixuan Yang, Zhen Luo, Wanshui Gan, et al.

Poly-EPO：探索性推理模型的训练

MEMO：记忆即模型

ACC：编译 Agent 轨迹以进行长上下文训练

全注意力卷土重来：在百步训练内将全注意力转移至稀疏

$π$ -Bench：在长周期工作流中评估主动式个人助理 Agent

感知还是偏见：多模态大语言模型能否超越对人格的初印象？

TransitLM：面向无地图 transit 路线生成的超大规模数据集与基准

DelTA：基于可验证奖励强化学习的判别性 Token 信用分配

交互评估需要一种设计科学

ESI-BENCH：迈向闭环感知-行动的具身空间智能

基于多视觉光谱无人机影像的军事目标检测对比分析

精神科诊断的自动化ICD分类：从经典NLP到大语言模型

利用社区 IBR 的剩余容量实现配电网中协调的最优电能质量管理

EllipseLIO：基于椭球表示的自适应激光雷达惯性里程计

SMoA：用于参数高效微调的频谱调制适配器

通过谱回归分析检测被植入特洛伊木马的深度神经网络

思维幻象：基于问题复杂度的视角理解推理模型的优势与局限

生成式递归推理

安全预训练：迈向下一代安全人工智能

RubricEM：超越可验证奖励的基于评分指南的策略分解元强化学习

当视觉为声音代言

AutoResearchClaw：基于人机协作的自我强化自主研究

使用学习到的可靠性进行过程奖励

GoLongRL：面向能力的多任务对齐长上下文强化学习

OpenComputer：面向 Computer-Use Agent 的可验证软件世界

基于点互信息的推理强化学习中的反自蒸馏

通过对比对搜索实现靶向神经元调控

连续扩散模型在语言任务中与离散扩散模型具有相当的竞争力

KVPO：基于KV语义探索的自回归视频对齐的ODE原生GRPO

代码即房间：通过 Agent 代码合成从俯视图图像生成 3D 房间

Poly-EPO：探索性推理模型的训练

MEMO：记忆即模型

ACC：编译 Agent 轨迹以进行长上下文训练

全注意力卷土重来：在百步训练内将全注意力转移至稀疏

$π$ -Bench：在长周期工作流中评估主动式个人助理 Agent

感知还是偏见：多模态大语言模型能否超越对人格的初印象？

TransitLM：面向无地图 transit 路线生成的超大规模数据集与基准

DelTA：基于可验证奖励强化学习的判别性 Token 信用分配

交互评估需要一种设计科学

ESI-BENCH：迈向闭环感知-行动的具身空间智能

基于多视觉光谱无人机影像的军事目标检测对比分析

精神科诊断的自动化ICD分类：从经典NLP到大语言模型

利用社区 IBR 的剩余容量实现配电网中协调的最优电能质量管理

EllipseLIO：基于椭球表示的自适应激光雷达惯性里程计

SMoA：用于参数高效微调的频谱调制适配器

通过谱回归分析检测被植入特洛伊木马的深度神经网络

思维幻象：基于问题复杂度的视角理解推理模型的优势与局限

生成式递归推理

安全预训练：迈向下一代安全人工智能

RubricEM：超越可验证奖励的基于评分指南的策略分解元强化学习

当视觉为声音代言

AutoResearchClaw：基于人机协作的自我强化自主研究

使用学习到的可靠性进行过程奖励

GoLongRL：面向能力的多任务对齐长上下文强化学习

OpenComputer：面向 Computer-Use Agent 的可验证软件世界

基于点互信息的推理强化学习中的反自蒸馏

通过对比对搜索实现靶向神经元调控

连续扩散模型在语言任务中与离散扩散模型具有相当的竞争力

KVPO：基于KV语义探索的自回归视频对齐的ODE原生GRPO

代码即房间：通过 Agent 代码合成从俯视图图像生成 3D 房间

Command Palette

论文

Command Palette

论文

Command Palette

论文