HyperAI超神经

超越当前观测：在可控非马尔可夫博弈中评估多模态大语言模型

多模态

LLM

Shengyuan Ding, Xilin Wei, Xinyu Fang, et al.

LifeSciBench：在生命科学的真实、专家级任务中评估语言模型

基准

LLM

Amelia Liu, Andrew Ho, Anne Marie Droste, et al.

TRIAGE：基于辩证推理的可解释风险预测——针对不规则采样医学时间序列结合大语言模型

LLM

模型训练

Hyeongwon Jang, Gyouk Chu, Changhun Kim, et al.

Agent

具身智能

Jaward Sesay, Yue Yu, Siwei Dong, et al.

代码生成

Agent

Tongxu Luo, Rongsheng Wang, Jiaxi Bi, et al.

强化学习

LLM

Byung-Kwan Lee, Ximing Lu, Shizhe Diao, et al.

多模态

监督式微调

Hao Li, Ganlong Zhao, Yufei Liu, et al.

Transformer

代码生成

Jian Yang, Shawn Guo, Wei Zhang, et al.

LLM

文本生成

Marcus Williams, Hannah Sheahan, Cameron Raymond, et al.

LLM

代码生成

Shaoqiu Zhang, Maoquan Wang, Yuling Shi, et al.

推理

监督式微调

Sen Xu, Shixi Liu, Wei Wang, et al.

扩散模型

文生视频

DreamX Team, Yancheng Bai, Rui Chen, et al.

多模态

多模态表征

Jisang Han, Seonghu Jeon, Jaewoo Jung, et al.

多模态

LLM

Kevin Qinghong Lin, Batu EI, Yuhong Shi, et al.

多模态

视频理解

Dingyu Yao, Junhao Zhou, Chenxu Yang, et al.

语音生成

深度估计

扩散模型

Hongfei Zhang, Harold Haodong Chen, Chenfei Liao, et al.

深度学习

AI for Science

Tianao Li, Emma Alexander

人工智能

Judah Goldfeder, Philippe Wyder, Yann LeCun, et al.

LLM

文本生成

Kartik Chandra, Max Kleiman-Weiner, Jonathan Ragan-Kelley, et al.

Agent

LLM

Natalie Shapira, Chris Wendler, Avery Yen, et al.

Fan Zhang, Vireo Zhang, Shengju Qian, et al.

LLM

Agent

Yongheng Zhang, Ziang Liu, Jiaxuan Zhu, et al.

Agent

LLM

Shuo Ji, Yibo Li, Bryan Hooi

强化学习

Agent

Xucong Wang, Ziyu Ma, Yong Wang, et al.

视频生成

扩散模型

Jiwen Liu, Shujuan Li, Zhixue Fang, et al.

图像生成

多模态

Dian Zheng, Harry Lee Manyuan Zhang, Kaituo Feng, et al.

MaxProof：基于生成式-验证式强化学习与群体级测试时扩展的数学证明扩展方法

LLM

监督式微调

Jiacheng Chen, Xinyu Zhang, Shunkai Zhang, et al.

Agent

多模态

Seokju Cho, Ryo Hachiuma, Abhishek Badki, et al.

Agent

基准

Wanli Li, Bowen Zhou, Yunyao Yu, et al.

LLM

Transformer

Xunhao Lai, Weiqi Xu, Yufeng Yang, et al.

超越当前观测：在可控非马尔可夫博弈中评估多模态大语言模型

多模态

LLM

Shengyuan Ding, Xilin Wei, Xinyu Fang, et al.

LifeSciBench：在生命科学的真实、专家级任务中评估语言模型

基准

LLM

Amelia Liu, Andrew Ho, Anne Marie Droste, et al.

LLM

模型训练

Hyeongwon Jang, Gyouk Chu, Changhun Kim, et al.

Agent

具身智能

Jaward Sesay, Yue Yu, Siwei Dong, et al.

代码生成

Agent

Tongxu Luo, Rongsheng Wang, Jiaxi Bi, et al.

强化学习

LLM

Byung-Kwan Lee, Ximing Lu, Shizhe Diao, et al.

多模态

监督式微调

Hao Li, Ganlong Zhao, Yufei Liu, et al.

Transformer

代码生成

Jian Yang, Shawn Guo, Wei Zhang, et al.

LLM

文本生成

Marcus Williams, Hannah Sheahan, Cameron Raymond, et al.

LLM

代码生成

Shaoqiu Zhang, Maoquan Wang, Yuling Shi, et al.

推理

监督式微调

Sen Xu, Shixi Liu, Wei Wang, et al.

扩散模型

文生视频

DreamX Team, Yancheng Bai, Rui Chen, et al.

多模态

多模态表征

Jisang Han, Seonghu Jeon, Jaewoo Jung, et al.

多模态

LLM

Kevin Qinghong Lin, Batu EI, Yuhong Shi, et al.

多模态

视频理解

Dingyu Yao, Junhao Zhou, Chenxu Yang, et al.

语音生成

深度估计

扩散模型

Hongfei Zhang, Harold Haodong Chen, Chenfei Liao, et al.

深度学习

AI for Science

Tianao Li, Emma Alexander

人工智能

Judah Goldfeder, Philippe Wyder, Yann LeCun, et al.

LLM

文本生成

Kartik Chandra, Max Kleiman-Weiner, Jonathan Ragan-Kelley, et al.

Agent

LLM

Natalie Shapira, Chris Wendler, Avery Yen, et al.

Fan Zhang, Vireo Zhang, Shengju Qian, et al.

LLM

Agent

Yongheng Zhang, Ziang Liu, Jiaxuan Zhu, et al.

Agent

LLM

Shuo Ji, Yibo Li, Bryan Hooi

强化学习

Agent

Xucong Wang, Ziyu Ma, Yong Wang, et al.

视频生成

扩散模型

Jiwen Liu, Shujuan Li, Zhixue Fang, et al.

图像生成

多模态

Dian Zheng, Harry Lee Manyuan Zhang, Kaituo Feng, et al.

LLM

监督式微调

Jiacheng Chen, Xinyu Zhang, Shunkai Zhang, et al.

Agent

多模态

Seokju Cho, Ryo Hachiuma, Abhishek Badki, et al.

Agent

基准

Wanli Li, Bowen Zhou, Yunyao Yu, et al.

LLM

Transformer

Xunhao Lai, Weiqi Xu, Yufeng Yang, et al.

TRIAGE：基于辩证推理的可解释风险预测——针对不规则采样医学时间序列结合大语言模型

LectūraAgents：一种用于自适应个性化 AI 辅助学习与具身教学的多 Agent 框架

GameCraft-Bench：Agents能否在真实游戏引擎中端到端地构建可玩的游戏？

近端策略优化的最近发展区：提示中的教师，而非梯度

ACE-Ego-0：统一第一人称视角的人类与机器人数据用于VLA预训练

LoopCoder-v2：仅循环一次以实现高效的测试时计算扩展

通过模拟部署预测大语言模型发布前的安全性

FastContext：训练面向 Coding Agents 的高效仓库探索器

VibeThinker-3B：探索小型语言模型中可验证推理的前沿

DreamX-World 1.0：一种通用的交互式世界模型

用于机器人策略学习的几何动作模型

数据记者 Agent：将数据转化为可验证的多模态故事

JoyAI-VL-Interaction：实时视觉-语言交互智能

dots.tts 技术报告

基于生成先验的确定性视频深度估计

基于展开式 Plug-and-Play ADMM 的弱引力透镜星系图像解卷积

AI必须通过超人类自适应智能拥抱专业化

奉承型聊天机器人会导致妄想性螺旋，即使在理想贝叶斯主义者中也是如此

混沌代理

HarnessX：一个可组合、自适应且可演化的智能体制造工厂

Orchestra-o1：全模态 Agent 编排

从聊天机器人到数字同事：迈向持久自主人工智能的范式转变

记忆是重构的，而非检索的：面向 LLM Agents 的图记忆

APPO：智能体过程策略优化

OmniDirector：无需跨配对数据的一般性多样本摄像机克隆

InterleaveThinker：强化代理式交错生成

MaxProof：基于生成式-验证式强化学习与群体级测试时扩展的数学证明扩展方法

SpatialClaw：重新思考智能体空间推理的动作接口

WEAVEBENCH：面向混合界面计算机操作 Agent 的长程真实世界基准测试

MiniMax 稀疏注意力

TRIAGE：基于辩证推理的可解释风险预测——针对不规则采样医学时间序列结合大语言模型

LectūraAgents：一种用于自适应个性化 AI 辅助学习与具身教学的多 Agent 框架

GameCraft-Bench：Agents能否在真实游戏引擎中端到端地构建可玩的游戏？

近端策略优化的最近发展区：提示中的教师，而非梯度

ACE-Ego-0：统一第一人称视角的人类与机器人数据用于VLA预训练

LoopCoder-v2：仅循环一次以实现高效的测试时计算扩展

通过模拟部署预测大语言模型发布前的安全性

FastContext：训练面向 Coding Agents 的高效仓库探索器

VibeThinker-3B：探索小型语言模型中可验证推理的前沿

DreamX-World 1.0：一种通用的交互式世界模型

用于机器人策略学习的几何动作模型

数据记者 Agent：将数据转化为可验证的多模态故事

JoyAI-VL-Interaction：实时视觉-语言交互智能

dots.tts 技术报告

基于生成先验的确定性视频深度估计

基于展开式 Plug-and-Play ADMM 的弱引力透镜星系图像解卷积

AI必须通过超人类自适应智能拥抱专业化

奉承型聊天机器人会导致妄想性螺旋，即使在理想贝叶斯主义者中也是如此

混沌代理

HarnessX：一个可组合、自适应且可演化的智能体制造工厂

Orchestra-o1：全模态 Agent 编排

从聊天机器人到数字同事：迈向持久自主人工智能的范式转变

记忆是重构的，而非检索的：面向 LLM Agents 的图记忆

APPO：智能体过程策略优化

OmniDirector：无需跨配对数据的一般性多样本摄像机克隆

InterleaveThinker：强化代理式交错生成

MaxProof：基于生成式-验证式强化学习与群体级测试时扩展的数学证明扩展方法

SpatialClaw：重新思考智能体空间推理的动作接口

WEAVEBENCH：面向混合界面计算机操作 Agent 的长程真实世界基准测试

MiniMax 稀疏注意力

Command Palette

论文

Command Palette

论文

Command Palette

论文