HyperAI超神经

UniREditBench：一个统一的基于推理的图像编辑基准

基准

图生图

Feng Han, Yibin Wang, Chenglin Li, et al.

将测试时计算最优缩放泛化为可优化图

LLM

算法

Fali Wang, Jihai Chen, Shuhua Yang, et al.

扩散模型

深度估计

Ropeway Liu, Hangjie Yuan, Bo Dong, et al.

计算机视觉

Transformer

Xinjian Zhao, Wei Pang, Zhongkai Xue, et al.

推理

Transformer

Ling-Team, Ang Li, Ben Liu, et al.

NOBLE - 具有生物启发的潜在嵌入的神经算子，用于捕捉生物神经元模型中的实验变异性

深度学习

建模

Luca Ghafourpour, Valentin Duruisseaux, Bahareh Tolooshams, et al.

DeepSeek

推理

Pouya Hamadanian, Pantea Karimi, Arash Nasr-Esfahany, et al.

Agent

人工智能

Qishuo Hua, Lyumanshan Ye, Dayuan Fu, et al.

图像理解

计算机视觉

Yuhong Liu, Beichen Zhang, Yuhang Zang, et al.

LLM

文本生成

Chenze Shao, Darren Li, Fandong Meng, et al.

强化学习

监督式微调

Kang Chen, Zhihao Liu, Tonghe Zhang, et al.

LLM

Transformer

Mengzhao Chen, Meng Wu, Hui Jin, et al.

多模态

推理

Jiawei Gu, Yunzhuo Hao, Huichen Will Wang, et al.

Agent

安防

Qiushi Sun, Mukai Li, Zhoumianze Liu, et al.

Agent

LLM

Zewen Chi, Li Dong, Qingxiu Dong, et al.

强化学习

LLM

Bo Liu, Chuanyang Jin, Seungone Kim, et al.

Agent

人机交互

Mathieu Andreux, Märt Bakler, Yanael Barbier, et al.

扩散模型

机器人技术

Heeseong Shin, Byeongho Heo, Dongyoon Han, et al.

Agent

LLM

Jingran Zhang, Ning Li, Justin Cui

Transformer

LLM

Kimi Team, Yu Zhang, Zongyu Lin, et al.

统一多模态

LLM

Yufeng Cui, Honghao Chen, Haoge Deng, et al.

LLM

Transformer

Zhichao Wang, Dongyang Ma, Xinting Huang, et al.

人机交互

自然语言处理

Rishub Jain, Sophie Bridgers, Lili Janzer, et al.

LLM

监督式微调

Jamison Meindl, Yunsheng Tian, Tony Cui, et al.

视频生成

图生视频

Baolu Li, Yiming Zhang, Qinghe Wang, et al.

强化学习

推理

Taekhyun Park, Yongjae Lee, Hyerim Bae

LLM

推理

Rui-Jie Zhu, Zixuan Wang, Kai Hua, et al.

LLM

基准

Guoxin Chen, Jing Wu, Xinjie Chen, et al.

视频理解

推理

Shijian Wang, Jiarui Jin, Xingjian Wang, et al.

代码生成

多模态

Qiushi Sun, Jingyang Gong, Yang Liu, et al.

LLM

Agent

Wenhao Wang, Peizhi Niu, Zhao Xu, et al.

Transformer

扩散模型

Tung Nguyen, Tuan Pham, Troy Arcomano, et al.

UniREditBench：一个统一的基于推理的图像编辑基准

基准

图生图

Feng Han, Yibin Wang, Chenglin Li, et al.

将测试时计算最优缩放泛化为可优化图

LLM

算法

Fali Wang, Jihai Chen, Shuhua Yang, et al.

扩散模型

深度估计

Ropeway Liu, Hangjie Yuan, Bo Dong, et al.

计算机视觉

Transformer

Xinjian Zhao, Wei Pang, Zhongkai Xue, et al.

推理

Transformer

Ling-Team, Ang Li, Ben Liu, et al.

深度学习

建模

Luca Ghafourpour, Valentin Duruisseaux, Bahareh Tolooshams, et al.

DeepSeek

推理

Pouya Hamadanian, Pantea Karimi, Arash Nasr-Esfahany, et al.

Agent

人工智能

Qishuo Hua, Lyumanshan Ye, Dayuan Fu, et al.

图像理解

计算机视觉

Yuhong Liu, Beichen Zhang, Yuhang Zang, et al.

LLM

文本生成

Chenze Shao, Darren Li, Fandong Meng, et al.

强化学习

监督式微调

Kang Chen, Zhihao Liu, Tonghe Zhang, et al.

LLM

Transformer

Mengzhao Chen, Meng Wu, Hui Jin, et al.

多模态

推理

Jiawei Gu, Yunzhuo Hao, Huichen Will Wang, et al.

Agent

安防

Qiushi Sun, Mukai Li, Zhoumianze Liu, et al.

Agent

LLM

Zewen Chi, Li Dong, Qingxiu Dong, et al.

强化学习

LLM

Bo Liu, Chuanyang Jin, Seungone Kim, et al.

Agent

人机交互

Mathieu Andreux, Märt Bakler, Yanael Barbier, et al.

扩散模型

机器人技术

Heeseong Shin, Byeongho Heo, Dongyoon Han, et al.

Agent

LLM

Jingran Zhang, Ning Li, Justin Cui

Transformer

LLM

Kimi Team, Yu Zhang, Zongyu Lin, et al.

统一多模态

LLM

Yufeng Cui, Honghao Chen, Haoge Deng, et al.

LLM

Transformer

Zhichao Wang, Dongyang Ma, Xinting Huang, et al.

人机交互

自然语言处理

Rishub Jain, Sophie Bridgers, Lili Janzer, et al.

LLM

监督式微调

Jamison Meindl, Yunsheng Tian, Tony Cui, et al.

视频生成

图生视频

Baolu Li, Yiming Zhang, Qinghe Wang, et al.

强化学习

推理

Taekhyun Park, Yongjae Lee, Hyerim Bae

LLM

推理

Rui-Jie Zhu, Zixuan Wang, Kai Hua, et al.

LLM

基准

Guoxin Chen, Jing Wu, Xinjie Chen, et al.

视频理解

推理

Shijian Wang, Jiarui Jin, Xingjian Wang, et al.

代码生成

多模态

Qiushi Sun, Jingyang Gong, Yang Liu, et al.

LLM

Agent

Wenhao Wang, Peizhi Niu, Zhao Xu, et al.

Transformer

扩散模型

Tung Nguyen, Tuan Pham, Troy Arcomano, et al.

UniLumos：基于物理合理反馈的快速统一图像与视频重光照

视觉模型在图结构理解中的被低估的力量

每一次激活都更进一步：将通用推理器扩展至1万亿开放语言基础

NOBLE - 具有生物启发的潜在嵌入的神经算子，用于捕捉生物神经元模型中的实验变异性

胶质细胞：一种受人类启发的用于自动化系统设计与优化的AI

上下文工程2.0：上下文工程的上下文

空间-SSRL：通过自监督强化学习增强空间理解

连续自回归语言模型

π𝚁𝙻：基于流的视觉-语言-动作模型的在线RL微调

INT 与 FP：细粒度低比特量化格式的综合研究

ThinkMorph：多模态交错思维链推理中的涌现特性

OS-Sentinel：通过在真实工作流中混合验证实现安全增强的移动GUI Agent

代理型组织时代：与语言模型共同学习组织之道

SPICE：在语料库环境中进行自对弈提升推理能力

Surfer 2：下一代跨平台计算机使用Agent

扩散模型在机器人控制中的应用条件探索

Agent 能否征服网络？探索 ChatGPT Atlas Agent 在网络游戏中的前沿应用

Kimi Linear：一种表达性强、高效的Attention架构

Emu3.5：原生多模态模型是世界学习者

手动解码的终结：迈向真正端到端的语言模型

人类与AI的互补性：增强监督的目标

GPTOpt：面向高效基于LLM的黑箱优化

VFXMaster：通过上下文学习解锁动态视觉效果生成

基于流程挖掘的推理感知GRPO

通过循环语言模型实现潜在推理的扩展

ReForm：基于前瞻性有限序列优化的反思式自动形式化

Video-Thinker：通过强化学习激发“用视频进行思考”

JanusCoder：迈向代码智能的基础性视觉-程序化接口

MCP-Flow：助力LLM Agent掌握现实世界中多样化且可扩展的MCP工具

OmniCast：一种用于跨时间尺度天气预报的掩码潜在扩散模型

UniLumos：基于物理合理反馈的快速统一图像与视频重光照

视觉模型在图结构理解中的被低估的力量

每一次激活都更进一步：将通用推理器扩展至1万亿开放语言基础

NOBLE - 具有生物启发的潜在嵌入的神经算子，用于捕捉生物神经元模型中的实验变异性

胶质细胞：一种受人类启发的用于自动化系统设计与优化的AI

上下文工程2.0：上下文工程的上下文

空间-SSRL：通过自监督强化学习增强空间理解

连续自回归语言模型

π𝚁𝙻：基于流的视觉-语言-动作模型的在线RL微调

INT 与 FP：细粒度低比特量化格式的综合研究

ThinkMorph：多模态交错思维链推理中的涌现特性

OS-Sentinel：通过在真实工作流中混合验证实现安全增强的移动GUI Agent

代理型组织时代：与语言模型共同学习组织之道

SPICE：在语料库环境中进行自对弈提升推理能力

Surfer 2：下一代跨平台计算机使用Agent

扩散模型在机器人控制中的应用条件探索

Agent 能否征服网络？探索 ChatGPT Atlas Agent 在网络游戏中的前沿应用

Kimi Linear：一种表达性强、高效的Attention架构

Emu3.5：原生多模态模型是世界学习者

手动解码的终结：迈向真正端到端的语言模型

人类与AI的互补性：增强监督的目标

GPTOpt：面向高效基于LLM的黑箱优化

VFXMaster：通过上下文学习解锁动态视觉效果生成

基于流程挖掘的推理感知GRPO

通过循环语言模型实现潜在推理的扩展

ReForm：基于前瞻性有限序列优化的反思式自动形式化

Video-Thinker：通过强化学习激发“用视频进行思考”

JanusCoder：迈向代码智能的基础性视觉-程序化接口

MCP-Flow：助力LLM Agent掌握现实世界中多样化且可扩展的MCP工具

OmniCast：一种用于跨时间尺度天气预报的掩码潜在扩散模型

Command Palette

论文

Command Palette

论文

Command Palette

论文