HyperAI超神经

教LLM进行规划：用于符号规划的逻辑思维链指令微调

LLM

监督式微调

Pulkit Verma, Ngoc La, Anthony Favier, et al.

OpenHA：一系列开源的Minecraft层级化Agent模型

统一多模态

多任务学习

Zihao Wang, Muyao Li, Kaichen He, et al.

LLM

Agent

Deepro Choudhury, Sinead Williamson, Adam Goliński, et al.

Agent

推理

Xixi Wu, Kuan Li, Yida Zhao, et al.

Agent

推理

Zile Qiao, Guoxin Chen, Xuanzhong Chen, et al.

Agent

LLM

Runnan Fang, Shihao Cai, Baixuan Li, et al.

Agent

强化学习

Kuan Li, Zhongwang Zhang, Huifeng Yin, et al.

Agent

LLM

Liangcai Su, Zhen Zhang, Guangyu Li, et al.

检索增强生成

Agent

Zijian Li, Xin Guan, Bo Zhang, et al.

LLM

Transformer

Yuxi Li, Yi Liu, Gelei Deng, et al.

检索增强生成

LLM

Xiaoqiang Lin, Aritra Ghosh, Bryan Kian Hsiang Low, et al.

统一多模态

多任务学习

Yang Zhang, Chenwei Wang, Ouyang Lu, et al.

LLM

数据集

Gayathri Saranathan, Cong Xu, Mahammad Parwez Alam, et al.

视频生成

Transformer

Shengqu Cai, Ceyuan Yang, Lvmin Zhang, et al.

Yujun Lin, Zhekai Zhang, Song Han

扩散模型

多模态

Zixin Yin, Xili Dai, Duomin Wang, et al.

监督式微调

检索增强生成

Iman Barati, Mostafa Amiri, Heshaam Faili

多模态

推理

Pranav Pawar, Kavish Shah, Akshat Bhalani, et al.

3D 模型

数据集

Weipeng Zhong, Peizhou Cao, Yichen Jin, et al.

强化学习

Agent

Zhengxi Lu, Jiabo Ye, Fei Tang, et al.

数据集

视频理解

Yang Zhou, Yifan Wang, Jianjun Zhou, et al.

LLM

Transformer

Yiqun Shen, Song Yuan, Zhengze Zhang, et al.

建模

视频理解

Klemen Kotar, Wanhee Lee, Rahul Venkatesh, et al.

语音生成

统一多模态

Jun Zhan, Mingyang Han, Yuxuan Xie, et al.

检索增强生成

LLM

Duolin Sun, Dan Yang, Yue Shen, et al.

扩散模型

图像生成

Tao Han, Wanghan Xu, Junchao Gong, et al.

3D 生成

语义分割

Xinhao Yan, Jiachen Xu, Yang Li, et al.

LLM

推理

Akshit Sinha, Arvindh Arun, Shashwat Goel, et al.

数据集

LLM

Xingwei Tan, Mahathi Parvatham, Chiara Gambi, et al.

检索增强生成

LLM

Junnan Dong, Siyu An, Yifei Yu, et al.

机器视觉 3D

多模态表征

Yue Li, Qi Ma, Runyi Yang, et al.

教LLM进行规划：用于符号规划的逻辑思维链指令微调

LLM

监督式微调

Pulkit Verma, Ngoc La, Anthony Favier, et al.

OpenHA：一系列开源的Minecraft层级化Agent模型

统一多模态

多任务学习

Zihao Wang, Muyao Li, Kaichen He, et al.

LLM

Agent

Deepro Choudhury, Sinead Williamson, Adam Goliński, et al.

Agent

推理

Xixi Wu, Kuan Li, Yida Zhao, et al.

Agent

推理

Zile Qiao, Guoxin Chen, Xuanzhong Chen, et al.

Agent

LLM

Runnan Fang, Shihao Cai, Baixuan Li, et al.

Agent

强化学习

Kuan Li, Zhongwang Zhang, Huifeng Yin, et al.

Agent

LLM

Liangcai Su, Zhen Zhang, Guangyu Li, et al.

检索增强生成

Agent

Zijian Li, Xin Guan, Bo Zhang, et al.

LLM

Transformer

Yuxi Li, Yi Liu, Gelei Deng, et al.

检索增强生成

LLM

Xiaoqiang Lin, Aritra Ghosh, Bryan Kian Hsiang Low, et al.

统一多模态

多任务学习

Yang Zhang, Chenwei Wang, Ouyang Lu, et al.

LLM

数据集

Gayathri Saranathan, Cong Xu, Mahammad Parwez Alam, et al.

视频生成

Transformer

Shengqu Cai, Ceyuan Yang, Lvmin Zhang, et al.

Yujun Lin, Zhekai Zhang, Song Han

扩散模型

多模态

Zixin Yin, Xili Dai, Duomin Wang, et al.

监督式微调

检索增强生成

Iman Barati, Mostafa Amiri, Heshaam Faili

多模态

推理

Pranav Pawar, Kavish Shah, Akshat Bhalani, et al.

3D 模型

数据集

Weipeng Zhong, Peizhou Cao, Yichen Jin, et al.

强化学习

Agent

Zhengxi Lu, Jiabo Ye, Fei Tang, et al.

数据集

视频理解

Yang Zhou, Yifan Wang, Jianjun Zhou, et al.

LLM

Transformer

Yiqun Shen, Song Yuan, Zhengze Zhang, et al.

建模

视频理解

Klemen Kotar, Wanhee Lee, Rahul Venkatesh, et al.

语音生成

统一多模态

Jun Zhan, Mingyang Han, Yuxuan Xie, et al.

检索增强生成

LLM

Duolin Sun, Dan Yang, Yue Shen, et al.

扩散模型

图像生成

Tao Han, Wanghan Xu, Junchao Gong, et al.

3D 生成

语义分割

Xinhao Yan, Jiachen Xu, Yang Li, et al.

LLM

推理

Akshit Sinha, Arvindh Arun, Shashwat Goel, et al.

数据集

LLM

Xingwei Tan, Mahathi Parvatham, Chiara Gambi, et al.

检索增强生成

LLM

Junnan Dong, Siyu An, Yifei Yu, et al.

机器视觉 3D

多模态表征

Yue Li, Qi Ma, Runyi Yang, et al.

BED-LLM：基于LLM与贝叶斯实验设计的智能信息收集

ReSum：通过上下文摘要解锁长时程搜索智能

WebResearcher：在长时程Agent中释放无边界推理能力

通过环境扩展迈向通用Agent智能

WebSailor-V2：通过合成数据与可扩展强化学习弥合专有Agent的鸿沟

通过持续预训练扩展Agent

WebWeaver：通过动态大纲构建网络规模证据以支持开放式深度研究

大型语言模型中的Glitch Tokens：分类体系与有效检测

REFRAG：重新思考基于RAG的解码

对齐后引导：通过统一潜在引导适应视觉-语言-动作模型

SubLIME：基于秩相关性预测的子集选择用于数据高效的LLM评估

上下文混合用于长视频生成

MusicSwarm：用于音乐创作的生物启发式智能

LEGO：张量应用的时空加速器生成与优化

LazyDrag：通过显式对应关系实现多模态扩散Transformer上的稳定拖拽编辑

SearchInstruct：通过基于检索的指令数据集构建增强领域自适应

可解释的物理推理与视觉-语言模型的性能分类体系

InternScenes：一个大规模可模拟室内场景数据集，具备真实布局

UI-S1：通过半在线强化学习推进GUI自动化

OmniWorld：用于4D世界建模的多领域多模态数据集

LAVa：基于层级的KV缓存淘汰与动态预算分配

基于概率结构融合的世界建模

VStyle：一个基于口语指令的语音风格适配基准

HANRAG：启发式高精度抗噪声多跳问答增强生成

InfGen：一种与分辨率无关的可扩展图像合成范式

X-Part：高保真且结构一致的形状分解

收益递减的错觉：LLM中长时 horizon 执行的度量

IntrEx：用于建模教育对话中参与度的数据集

Youtu-GraphRAG：面向图检索增强型复杂推理的垂直统一Agent

SceneSplat：基于视觉-语言预训练的高斯点云场景理解

BED-LLM：基于LLM与贝叶斯实验设计的智能信息收集

ReSum：通过上下文摘要解锁长时程搜索智能

WebResearcher：在长时程Agent中释放无边界推理能力

通过环境扩展迈向通用Agent智能

WebSailor-V2：通过合成数据与可扩展强化学习弥合专有Agent的鸿沟

通过持续预训练扩展Agent

WebWeaver：通过动态大纲构建网络规模证据以支持开放式深度研究

大型语言模型中的Glitch Tokens：分类体系与有效检测

REFRAG：重新思考基于RAG的解码

对齐后引导：通过统一潜在引导适应视觉-语言-动作模型

SubLIME：基于秩相关性预测的子集选择用于数据高效的LLM评估

上下文混合用于长视频生成

MusicSwarm：用于音乐创作的生物启发式智能

LEGO：张量应用的时空加速器生成与优化

LazyDrag：通过显式对应关系实现多模态扩散Transformer上的稳定拖拽编辑

SearchInstruct：通过基于检索的指令数据集构建增强领域自适应

可解释的物理推理与视觉-语言模型的性能分类体系

InternScenes：一个大规模可模拟室内场景数据集，具备真实布局

UI-S1：通过半在线强化学习推进GUI自动化

OmniWorld：用于4D世界建模的多领域多模态数据集

LAVa：基于层级的KV缓存淘汰与动态预算分配

基于概率结构融合的世界建模

VStyle：一个基于口语指令的语音风格适配基准

HANRAG：启发式高精度抗噪声多跳问答增强生成

InfGen：一种与分辨率无关的可扩展图像合成范式

X-Part：高保真且结构一致的形状分解

收益递减的错觉：LLM中长时 horizon 执行的度量

IntrEx：用于建模教育对话中参与度的数据集

Youtu-GraphRAG：面向图检索增强型复杂推理的垂直统一Agent

SceneSplat：基于视觉-语言预训练的高斯点云场景理解

Command Palette

论文

Command Palette

论文

Command Palette

论文