HyperAI超神经

World Craft：通过文本创建可可视化世界的智能体框架

Agent

3D 生成

Jianwen Sun, Yukang Feng, Kaining Ying, et al.

视觉生成通过多模态世界模型解锁类人推理

多模态

推理

Jialong Wu, Xiaoying Zhang, Hongyi Yuan, et al.

深度估计

感知

Bin Tan, Changjiang Sun, Xiage Qin, et al.

机器人技术

具身智能

Wei Wu, Fan Lu, Yunnan Wang, et al.

推理

LLM

Mingyang Song, Haoyu Sun, Jiawei Gu, et al.

Agent

基准

Dongrui Liu, Qihan Ren, Chen Qian, et al.

LLM

模型训练

Varun Singh, Lucas Krauss, Sami Jaghouar, et al.

强化学习

推理

Shobhita Sundaram, John Quan, Ariel Kwiatkowski, et al.

LLM

语言

Shayne Longpre, Sneha Kudugunta, Niklas Muennighoff, et al.

图像生成

扩散模型

Bin Lin, Zongjian Li, Yuwei Niu, et al.

Transformer

LLM

Zecheng Tang, Quantong Qiu, Yi Yang, et al.

文生图

扩散模型

Honglin Lin, Chonghan Qin, Zheng Liu, et al.

文生视频

视频生成

Chenyu Mu, Xin He, Qu Yang, et al.

Agent

LLM

Ji Zeng, Dayuan Fu, Tiantian Mi, et al.

LLM

自然语言处理

Wei Zhou, Jun Zhou, Haoyu Wang, et al.

DeepSeek

文档理解

Haoran Wei, Yaofeng Sun, Yukun Li

强化学习

LLM

Mert Yuksekgonul, Daniel Koceja, Xinhao Li, et al.

监督式微调

开源

Jackson Kaunismaa, Avery Griffin, John Hughes, et al.

扩散模型

视频处理

Dohun Lee, Chun-Hao Paul Huang, Xuelin Chen, et al.

Agent

LLM

Yuxuan Wan, Tianqing Fang, Zaitang Li, et al.

Agent

具身智能

Zirui Wang, Junyi Zhang, Jiaxin Ge, et al.

TwinBrainVLA：通过非对称Transformer混合模型释放通用VLM在具身任务中的潜力

机器人技术

具身智能

Bin Yu, Shijie Lian, Xiaopeng Lin, et al.

Agent

代码生成

Yuhang Wang, Yuling Shi, Mo Yang, et al.

Agent

推理

Meituan LongCat Team, Anchun Gui, Bei Li, et al.

Agent

LLM

Haowei Lin, Haotian Ye, Wenzheng Feng, et al.

视频生成

机器人技术

Moo Jin Kim, Yihuai Gao, Tsung-Yi Lin, et al.

Triton-distributed：使用 Triton 编译器在分布式 AI 系统中编程重叠内核

Zheng Size, Wenlei Bao, Qi Hou, et al.

文生图

扩散模型

Shengbang Tong, Boyang Zheng, Ziteng Wang, et al.

机器人技术

多模态表征

Shijie Lian, Bin Yu, Xiaopeng Lin, et al.

扩散模型

推理

Zanlin Ni, Shenzhi Wang, Yang Yue, et al.

Agent

LLM

Daixuan Cheng, Shaohan Huang, Yuxian Gu, et al.

视频理解

视频处理

Haowei Zhang, Shudong Yang, Jinlan Fu, et al.

World Craft：通过文本创建可可视化世界的智能体框架

Agent

3D 生成

Jianwen Sun, Yukang Feng, Kaining Ying, et al.

视觉生成通过多模态世界模型解锁类人推理

多模态

推理

Jialong Wu, Xiaoying Zhang, Hongyi Yuan, et al.

深度估计

感知

Bin Tan, Changjiang Sun, Xiage Qin, et al.

机器人技术

具身智能

Wei Wu, Fan Lu, Yunnan Wang, et al.

推理

LLM

Mingyang Song, Haoyu Sun, Jiawei Gu, et al.

Agent

基准

Dongrui Liu, Qihan Ren, Chen Qian, et al.

LLM

模型训练

Varun Singh, Lucas Krauss, Sami Jaghouar, et al.

强化学习

推理

Shobhita Sundaram, John Quan, Ariel Kwiatkowski, et al.

LLM

语言

Shayne Longpre, Sneha Kudugunta, Niklas Muennighoff, et al.

图像生成

扩散模型

Bin Lin, Zongjian Li, Yuwei Niu, et al.

Transformer

LLM

Zecheng Tang, Quantong Qiu, Yi Yang, et al.

文生图

扩散模型

Honglin Lin, Chonghan Qin, Zheng Liu, et al.

文生视频

视频生成

Chenyu Mu, Xin He, Qu Yang, et al.

Agent

LLM

Ji Zeng, Dayuan Fu, Tiantian Mi, et al.

LLM

自然语言处理

Wei Zhou, Jun Zhou, Haoyu Wang, et al.

DeepSeek

文档理解

Haoran Wei, Yaofeng Sun, Yukun Li

强化学习

LLM

Mert Yuksekgonul, Daniel Koceja, Xinhao Li, et al.

监督式微调

开源

Jackson Kaunismaa, Avery Griffin, John Hughes, et al.

扩散模型

视频处理

Dohun Lee, Chun-Hao Paul Huang, Xuelin Chen, et al.

Agent

LLM

Yuxuan Wan, Tianqing Fang, Zaitang Li, et al.

Agent

具身智能

Zirui Wang, Junyi Zhang, Jiaxin Ge, et al.

机器人技术

具身智能

Bin Yu, Shijie Lian, Xiaopeng Lin, et al.

Agent

代码生成

Yuhang Wang, Yuling Shi, Mo Yang, et al.

Agent

推理

Meituan LongCat Team, Anchun Gui, Bei Li, et al.

Agent

LLM

Haowei Lin, Haotian Ye, Wenzheng Feng, et al.

视频生成

机器人技术

Moo Jin Kim, Yihuai Gao, Tsung-Yi Lin, et al.

Zheng Size, Wenlei Bao, Qi Hou, et al.

文生图

扩散模型

Shengbang Tong, Boyang Zheng, Ziteng Wang, et al.

机器人技术

多模态表征

Shijie Lian, Bin Yu, Xiaopeng Lin, et al.

扩散模型

推理

Zanlin Ni, Shenzhi Wang, Yang Yue, et al.

Agent

LLM

Daixuan Cheng, Shaohan Huang, Yuxian Gu, et al.

视频理解

视频处理

Haowei Zhang, Shudong Yang, Jinlan Fu, et al.

掩码深度建模用于空间感知

一种实用的VLA基础模型

AdaReasoner：用于迭代视觉推理的动态工具编排

AgentDoG：面向AI Agent安全与可信的诊断防护框架

Arcee Trinity 大型技术报告

让模型学会自我教学：在可学习性边缘的推理

ATLAS：多语言预训练、微调与解码多语言困境的自适应迁移缩放定律

iFSQ：仅需一行代码提升图像生成中的FSQ性能

弹性注意力：面向高效Transformer的测试时自适应稀疏率

科学图像生成：基准测试、方法论及下游应用价值

脚本即一切：一种面向长时程对话到影视视频生成的智能体框架

daVinci-Dev：面向软件工程的Agent原生中段训练

LLM能否帮你收拾烂摊子？基于LLM的应用就绪数据准备综述

DeepSeek-OCR 2：视觉因果流

学习测试时发现

通过在防护输出上微调以诱发有害能力

Memory-V2V：通过记忆增强视频到视频扩散模型

推理时扩展验证：通过测试时评分标准引导的验证实现自演化深度研究Agent

VisGym：面向多模态Agent的多样化、可定制化、可扩展环境

TwinBrainVLA：通过非对称Transformer混合模型释放通用VLM在具身任务中的潜力

SWE-Pruner：面向编码Agent的自适应上下文剪枝

LongCat-Flash-Thinking-2601 技术报告

语言模型能否发现缩放定律？

Cosmos Policy：针对视觉运动控制与规划微调视频模型

Triton-distributed：使用 Triton 编译器在分布式 AI 系统中编程重叠内核

基于表征自编码器的文本到图像扩散Transformer的扩展

BayesianVLA：通过潜在动作查询对视觉-语言-动作模型进行贝叶斯分解

灵活性陷阱：为何任意顺序限制制约了扩散语言模型的推理潜力

沙箱中的LLM激发通用代理智能

HERMES：将KV缓存作为分层内存以实现高效的流式视频理解

掩码深度建模用于空间感知

一种实用的VLA基础模型

AdaReasoner：用于迭代视觉推理的动态工具编排

AgentDoG：面向AI Agent安全与可信的诊断防护框架

Arcee Trinity 大型技术报告

让模型学会自我教学：在可学习性边缘的推理

ATLAS：多语言预训练、微调与解码多语言困境的自适应迁移缩放定律

iFSQ：仅需一行代码提升图像生成中的FSQ性能

弹性注意力：面向高效Transformer的测试时自适应稀疏率

科学图像生成：基准测试、方法论及下游应用价值

脚本即一切：一种面向长时程对话到影视视频生成的智能体框架

daVinci-Dev：面向软件工程的Agent原生中段训练

LLM能否帮你收拾烂摊子？基于LLM的应用就绪数据准备综述

DeepSeek-OCR 2：视觉因果流

学习测试时发现

通过在防护输出上微调以诱发有害能力

Memory-V2V：通过记忆增强视频到视频扩散模型

推理时扩展验证：通过测试时评分标准引导的验证实现自演化深度研究Agent

VisGym：面向多模态Agent的多样化、可定制化、可扩展环境

TwinBrainVLA：通过非对称Transformer混合模型释放通用VLM在具身任务中的潜力

SWE-Pruner：面向编码Agent的自适应上下文剪枝

LongCat-Flash-Thinking-2601 技术报告

语言模型能否发现缩放定律？

Cosmos Policy：针对视觉运动控制与规划微调视频模型

Triton-distributed：使用 Triton 编译器在分布式 AI 系统中编程重叠内核

基于表征自编码器的文本到图像扩散Transformer的扩展

BayesianVLA：通过潜在动作查询对视觉-语言-动作模型进行贝叶斯分解

灵活性陷阱：为何任意顺序限制制约了扩散语言模型的推理潜力

沙箱中的LLM激发通用代理智能

HERMES：将KV缓存作为分层内存以实现高效的流式视频理解

Command Palette

论文

Command Palette

论文

Command Palette

论文