HyperAI超神经

Multi-Crit：基于多元标准遵循的多模态评判基准

基准

多模态

Tianyi Xiong, Yi Ge, Ming Li, et al.

MIRA：用于图像编辑的多模态迭代推理Agent

多模态

扩散模型

Ziyun Zeng, Hang Hua, Jiebo Luo

视觉问答

具身智能

Qineng Wang, Wenlong Huang, Yu Zhou, et al.

扩散模型

图像生成

Yusuf Dalva, Guocheng Gordon Qian, Maya Goldenberg, et al.

统一多模态

扩散模型

Xiaoyue Mi, Wenqing Yu, Jiesong Lian, et al.

LLM

推理

Zhihong Shao, Yuxiang Luo, Chengda Lu, et al.

Agent

推理

Hongjin Su, Shizhe Diao, Ximing Lu, et al.

多模态

推理

Beichen Zhang, Yuhang Zang, Xiaoyi Dong, et al.

扩散模型

统一多模态

Teng Hu, Zhentao Yu, Guozhen Zhang, et al.

视频理解

合成

Inferix Team, Tianyu Feng, Yizeng Han, et al.

Agent

LLM

Jiaru Zou, Xiyuan Yang, Ruizhong Qiu, et al.

多模态

基准

Artem Chervyakov, Ulyana Isaeva, Anton Emelyanov, et al.

LLM

Transformer

Wei He, Kai Han, Hang Zhou, et al.

机器学习

人工智能

Yizhou Liu, Ziming Liu, Jeff Gore

机器学习

人工智能

Zachary Chase, Steve Hanneke, Shay Moran, et al.

强化学习

LLM

Yang Yue, Zhiqi Chen, Rui Lu, et al.

扩散模型

深度学习

Tony Bonnaire, Raphaël Urfin, Giulio Biroli, et al.

强化学习

神经网络

Kevin Wang, Ishaan Javali, Michał Bortkiewicz, et al.

Transformer

LLM

Zihan Qiu, Zekun Wang, Bo Zheng, et al.

LLM

数据集

Liwei Jiang, Yuanjun Chai, Margaret Li, et al.

模型训练

LLM

Bidipta Sarkar, Mattie Fellows, Juan Agustin Duque, et al.

统一多模态

推理

Yuwei Niu, Weiyang Jin, Jiaqi Liao, et al.

统一多模态

图像生成

Zhoujie Fu, Xianfang Zeng, Jinghong Lan, et al.

Agent

推理

Jiaqi Liu, Kaiwen Xiong, Peng Xia, et al.

图像分割

统一多模态

Anglin Liu, Rundong Xue, Xu R. Cao, et al.

图生视频

图生图

Jiaming Zhang, Shengming Cao, Rui Li, et al.

LLM

算法

Valentin Khrulkov, Andrey Galichin, Denis Bashkirov, et al.

偏好

基准

Oren Barkan, Yahlly Schein, Yehonatan Elisha, et al.

深度学习

神经网络

Dor Arviv, Yehonatan Elisha, Oren Barkan, et al.

目标检测

语义分割

Leena Alghamdi, Muhammad Usman, Hafeez Anwar, et al.

Agent

LLM

Tengxiao Liu, Zifeng Wang, Jin Miao, et al.

图生视频

视频生成

Gongfan Fang, Xinyin Ma, Xinchao Wang

Multi-Crit：基于多元标准遵循的多模态评判基准

基准

多模态

Tianyi Xiong, Yi Ge, Ming Li, et al.

MIRA：用于图像编辑的多模态迭代推理Agent

多模态

扩散模型

Ziyun Zeng, Hang Hua, Jiebo Luo

视觉问答

具身智能

Qineng Wang, Wenlong Huang, Yu Zhou, et al.

扩散模型

图像生成

Yusuf Dalva, Guocheng Gordon Qian, Maya Goldenberg, et al.

统一多模态

扩散模型

Xiaoyue Mi, Wenqing Yu, Jiesong Lian, et al.

LLM

推理

Zhihong Shao, Yuxiang Luo, Chengda Lu, et al.

Agent

推理

Hongjin Su, Shizhe Diao, Ximing Lu, et al.

多模态

推理

Beichen Zhang, Yuhang Zang, Xiaoyi Dong, et al.

扩散模型

统一多模态

Teng Hu, Zhentao Yu, Guozhen Zhang, et al.

视频理解

合成

Inferix Team, Tianyu Feng, Yizeng Han, et al.

Agent

LLM

Jiaru Zou, Xiyuan Yang, Ruizhong Qiu, et al.

多模态

基准

Artem Chervyakov, Ulyana Isaeva, Anton Emelyanov, et al.

LLM

Transformer

Wei He, Kai Han, Hang Zhou, et al.

机器学习

人工智能

Yizhou Liu, Ziming Liu, Jeff Gore

机器学习

人工智能

Zachary Chase, Steve Hanneke, Shay Moran, et al.

强化学习

LLM

Yang Yue, Zhiqi Chen, Rui Lu, et al.

扩散模型

深度学习

Tony Bonnaire, Raphaël Urfin, Giulio Biroli, et al.

强化学习

神经网络

Kevin Wang, Ishaan Javali, Michał Bortkiewicz, et al.

Transformer

LLM

Zihan Qiu, Zekun Wang, Bo Zheng, et al.

LLM

数据集

Liwei Jiang, Yuanjun Chai, Margaret Li, et al.

模型训练

LLM

Bidipta Sarkar, Mattie Fellows, Juan Agustin Duque, et al.

统一多模态

推理

Yuwei Niu, Weiyang Jin, Jiaqi Liao, et al.

统一多模态

图像生成

Zhoujie Fu, Xianfang Zeng, Jinghong Lan, et al.

Agent

推理

Jiaqi Liu, Kaiwen Xiong, Peng Xia, et al.

图像分割

统一多模态

Anglin Liu, Rundong Xue, Xu R. Cao, et al.

图生视频

图生图

Jiaming Zhang, Shengming Cao, Rui Li, et al.

LLM

算法

Valentin Khrulkov, Andrey Galichin, Denis Bashkirov, et al.

偏好

基准

Oren Barkan, Yahlly Schein, Yehonatan Elisha, et al.

深度学习

神经网络

Dor Arviv, Yehonatan Elisha, Oren Barkan, et al.

目标检测

语义分割

Leena Alghamdi, Muhammad Usman, Hafeez Anwar, et al.

Agent

LLM

Tengxiao Liu, Zifeng Wang, Jin Miao, et al.

图生视频

视频生成

Gongfan Fang, Xinyin Ma, Xinchao Wang

ENACT：基于第一人称交互世界建模的具身认知评估

画布到图像：基于多模态控制的组合图像生成

视频生成模型是优秀的潜在奖励模型

DeepSeekMath-V2：迈向自验证的数学推理

ToolOrchestra：通过高效的模型与工具编排提升智能

视觉思考，文本推理：ARC中的视觉-语言协同作用

和谐：通过跨任务协同实现音频与视频生成的协同统一

Inferix：一种基于块扩散的下一代推理引擎，用于世界模拟

多智能体系统中的潜在协作

多模态评估俄语语言架构

ROOT：用于神经网络训练的鲁棒正交化优化器

叠加效应带来稳健的神经缩放

直接在线学习的最优错误界

强化学习是否真的能够激励LLM在基础模型之外提升推理能力？

扩散模型为何不会记忆：训练中隐式动力学正则化的作用

用于自监督强化学习的1000层网络：增加深度可实现新的目标达成能力

用于大型语言模型的门控注意力：非线性、稀疏性与无注意力陷阱

人工蜂群智能：语言模型（及更广泛领域）的开放性同质性

超大规模下的进化策略

理解是否推动统一多模态模型中的生成？从分析到未来路径

iMontage：统一、通用、高度动态的多对多图像生成

Agent0-VL：探索面向工具融合的视觉-语言推理的自演化智能体

MedSAM3：基于医学概念深入探索通用图像分割

SteadyDancer：基于首帧保留的协调一致的人体图像动画

GigaEvo：一个由 LLMs 和进化算法驱动的开源优化框架

基于随机路径积分的忠实度感知推荐解释

提取推荐系统中的交互感知单语义概念

MSRNet：用于伪装目标检测的多尺度递归网络

预算感知工具使用实现Agent的有效扩展

视频内指令：视觉信号作为生成控制

ENACT：基于第一人称交互世界建模的具身认知评估

画布到图像：基于多模态控制的组合图像生成

视频生成模型是优秀的潜在奖励模型

DeepSeekMath-V2：迈向自验证的数学推理

ToolOrchestra：通过高效的模型与工具编排提升智能

视觉思考，文本推理：ARC中的视觉-语言协同作用

和谐：通过跨任务协同实现音频与视频生成的协同统一

Inferix：一种基于块扩散的下一代推理引擎，用于世界模拟

多智能体系统中的潜在协作

多模态评估俄语语言架构

ROOT：用于神经网络训练的鲁棒正交化优化器

叠加效应带来稳健的神经缩放

直接在线学习的最优错误界

强化学习是否真的能够激励LLM在基础模型之外提升推理能力？

扩散模型为何不会记忆：训练中隐式动力学正则化的作用

用于自监督强化学习的1000层网络：增加深度可实现新的目标达成能力

用于大型语言模型的门控注意力：非线性、稀疏性与无注意力陷阱

人工蜂群智能：语言模型（及更广泛领域）的开放性同质性

超大规模下的进化策略

理解是否推动统一多模态模型中的生成？从分析到未来路径

iMontage：统一、通用、高度动态的多对多图像生成

Agent0-VL：探索面向工具融合的视觉-语言推理的自演化智能体

MedSAM3：基于医学概念深入探索通用图像分割

SteadyDancer：基于首帧保留的协调一致的人体图像动画

GigaEvo：一个由 LLMs 和进化算法驱动的开源优化框架

基于随机路径积分的忠实度感知推荐解释

提取推荐系统中的交互感知单语义概念

MSRNet：用于伪装目标检测的多尺度递归网络

预算感知工具使用实现Agent的有效扩展

视频内指令：视觉信号作为生成控制

Command Palette

论文

Command Palette

论文

Command Palette

论文