HyperAI超神经

MMBench-GUI：面向GUI代理的分层多平台评估框架

基准

Agent

Xuehui Wang, Zhenyu Wu, JingJing Xie, et al.

深度研究者与测试时扩散

检索增强生成

推理

Rujun Han, Yanfei Chen, Zoey CuiZhu, et al.

LLM

算法

Jiale Chen, Torsten Hoefler, Dan Alistarh

医学影像

多模态

Siyi Xun, Yue Sun, Jingkun Chen, et al.

Agent

基准

Xuetian Chen, Yinghao Chen, Xinfeng Yuan, et al.

强化学习

LLM

Shangke Lyu, Linjuan Wu, Yuchen Yan, et al.

文生视频

统一多模态

Junfei Xiao, Ceyuan Yang, Lvmin Zhang, et al.

推理

LLM

Xingyu Wu, Yuchen Yan, Shangke Lyu, et al.

LLM

推理

Hang Yan, Fangzhi Xu, Rongman Xu, et al.

Transformer

视频生成

Dmitrii Mikhailov, Aleksey Letunovskiy, Maria Kovaleva, et al.

强化学习

LLM

Chujie Zheng, Shixuan Liu, Mingze Li, et al.

文档理解

多模态

Luca Soldaini, Kyle Lo, Christopher Wilhelm, et al.

推理

多模态

Yicheng Bao, Guanxu Chen, Mingkang Chen, et al.

LLM

推理

Mutian Yang, Jiandong Gao, Ji Wu

Re:Form -- 在LLMs中使用强化学习减少人类先验知识的可扩展形式化软件验证：关于Dafny的初步研究

监督式微调

LLM

Chuanhao Yan, Fengdi Che, Xuhan Huang, et al.

检索增强生成

Agent

Yilong Xu, Xiang Long, Zhi Zheng, et al.

强化学习

LLM

Yu Li, Zhuoshi Pan, Honglin Lin, et al.

人机交互

文档理解

Jooyeol Yun, Heng Wang, Yotaro Shimose, et al.

图生视频

扩散模型

Xiaofeng Mao, Shaoheng Lin, Zhen Li, et al.

多模态

基准

Hongcheng Gao, Zihao Huang, Lin Xu, et al.

视觉问答

医学影像

Xinyao Liu, Diping Song

LLM

剑桥大学

Mandar Pitale, Jelena Frtunikj, Abhinaw Priyadershi, et al.

多模态

推理

Ang Li, Charles Wang, Kaiyu Yue, et al.

强化学习

视觉问答

Junhao Shen, Haiteng Zhao, Yuzhe Gu, et al.

扩散模型

图像生成

Wongi Jeong, Kyungryeol Lee, Hoigi Seo, et al.

数据集

推理

Run-Ze Fan, Zengzhi Wang, Pengfei Liu

LLM

语音生成

Boyong Wu, Chao Yan, Chen Hu, et al.

LLM

推理

Hongyin Luo, Nathaniel Morgan, Tina Li, et al.

建模

安防

Xiaoyang Chen, Yunhao Chen, Zeren Chen, et al.

强化学习

Transformer

Mian Ibad Ali Shah, Enda Barrett, Karl Mason

图像生成

数据集

Maksim Kuprashevich, Grigorii Alekseenko, Irina Tolstykh, et al.

3D 生成

语义分割

Hayeon Kim, Ji Ha Jang, Se Young Chun

MMBench-GUI：面向GUI代理的分层多平台评估框架

基准

Agent

Xuehui Wang, Zhenyu Wu, JingJing Xie, et al.

深度研究者与测试时扩散

检索增强生成

推理

Rujun Han, Yanfei Chen, Zoey CuiZhu, et al.

LLM

算法

Jiale Chen, Torsten Hoefler, Dan Alistarh

医学影像

多模态

Siyi Xun, Yue Sun, Jingkun Chen, et al.

Agent

基准

Xuetian Chen, Yinghao Chen, Xinfeng Yuan, et al.

强化学习

LLM

Shangke Lyu, Linjuan Wu, Yuchen Yan, et al.

文生视频

统一多模态

Junfei Xiao, Ceyuan Yang, Lvmin Zhang, et al.

推理

LLM

Xingyu Wu, Yuchen Yan, Shangke Lyu, et al.

LLM

推理

Hang Yan, Fangzhi Xu, Rongman Xu, et al.

Transformer

视频生成

Dmitrii Mikhailov, Aleksey Letunovskiy, Maria Kovaleva, et al.

强化学习

LLM

Chujie Zheng, Shixuan Liu, Mingze Li, et al.

文档理解

多模态

Luca Soldaini, Kyle Lo, Christopher Wilhelm, et al.

推理

多模态

Yicheng Bao, Guanxu Chen, Mingkang Chen, et al.

LLM

推理

Mutian Yang, Jiandong Gao, Ji Wu

监督式微调

LLM

Chuanhao Yan, Fengdi Che, Xuhan Huang, et al.

检索增强生成

Agent

Yilong Xu, Xiang Long, Zhi Zheng, et al.

强化学习

LLM

Yu Li, Zhuoshi Pan, Honglin Lin, et al.

人机交互

文档理解

Jooyeol Yun, Heng Wang, Yotaro Shimose, et al.

图生视频

扩散模型

Xiaofeng Mao, Shaoheng Lin, Zhen Li, et al.

多模态

基准

Hongcheng Gao, Zihao Huang, Lin Xu, et al.

视觉问答

医学影像

Xinyao Liu, Diping Song

LLM

剑桥大学

Mandar Pitale, Jelena Frtunikj, Abhinaw Priyadershi, et al.

多模态

推理

Ang Li, Charles Wang, Kaiyu Yue, et al.

强化学习

视觉问答

Junhao Shen, Haiteng Zhao, Yuzhe Gu, et al.

扩散模型

图像生成

Wongi Jeong, Kyungryeol Lee, Hoigi Seo, et al.

数据集

推理

Run-Ze Fan, Zengzhi Wang, Pengfei Liu

LLM

语音生成

Boyong Wu, Chao Yan, Chen Hu, et al.

LLM

推理

Hongyin Luo, Nathaniel Morgan, Tina Li, et al.

建模

安防

Xiaoyang Chen, Yunhao Chen, Zeren Chen, et al.

强化学习

Transformer

Mian Ibad Ali Shah, Enda Barrett, Karl Mason

图像生成

数据集

Maksim Kuprashevich, Grigorii Alekseenko, Irina Tolstykh, et al.

3D 生成

语义分割

Hayeon Kim, Ji Ha Jang, Se Young Chun

LLM量化几何：GPTQ作为Babai的最近平面算法

MedIQA：一种可扩展的基于提示的医学图像质量评估基础模型

OS-MAP: 计算机使用代理在广度和深度上能走多远？

分层预算策略优化用于自适应推理

《电影导演：面向短片生成》

LAPO：通过长度自适应策略优化内化推理效率

MUR：基于动量不确定性的大语言模型推理

NABLA：邻域自适应块级注意力

组序列策略优化

olmOCR：利用视觉语言模型解锁PDF中的数万亿个Token

SafeWork-R1: 在AI-45法则下的安全与智能协同进化

解耦大语言模型中的知识与推理：基于认知双系统理论的探索

Re:Form -- 在LLMs中使用强化学习减少人类先验知识的可扩展形式化软件验证：关于Dafny的初步研究

RAVine：现实对齐的代理搜索评估

“一个领域能否帮助其他领域？”基于数据的多领域强化学习推理研究

DesignLab：通过迭代检测与修正设计幻灯片

Yume：一个交互式世界生成模型

像素、模式，但无诗意：像人类一样看世界

构建用于定位诊断协作的眼科多模态LLM通过临床认知链推理

HySafe-AI：AI系统混合安全架构分析框架：案例研究

斑马-CoT：一种交叉视觉语言推理数据集

基于视觉-语言慢思考的半离策略强化学习

上采样关键区域：面向加速扩散变换器的区域自适应潜在采样

《MegaScience：推动科学推理的训练后数据集前沿》

Step-Audio 2 技术报告

超越上下文限制：用于长时程推理的潜意识线索

前沿人工智能风险管理框架实践：风险分析技术报告

具有不确定性感知的知识转换器在多智能体强化学习中的对等能源交易研究

无需人类参与：自主高质量图像编辑三元组挖掘

基于正则化分数蒸馏采样的 3D 高斯点云中鲁棒的 3D 掩码部分级编辑

LLM量化几何：GPTQ作为Babai的最近平面算法

MedIQA：一种可扩展的基于提示的医学图像质量评估基础模型

OS-MAP: 计算机使用代理在广度和深度上能走多远？

分层预算策略优化用于自适应推理

《电影导演：面向短片生成》

LAPO：通过长度自适应策略优化内化推理效率

MUR：基于动量不确定性的大语言模型推理

NABLA：邻域自适应块级注意力

组序列策略优化

olmOCR：利用视觉语言模型解锁PDF中的数万亿个Token

SafeWork-R1: 在AI-45法则下的安全与智能协同进化

解耦大语言模型中的知识与推理：基于认知双系统理论的探索

Re:Form -- 在LLMs中使用强化学习减少人类先验知识的可扩展形式化软件验证：关于Dafny的初步研究

RAVine：现实对齐的代理搜索评估

“一个领域能否帮助其他领域？”基于数据的多领域强化学习推理研究

DesignLab：通过迭代检测与修正设计幻灯片

Yume：一个交互式世界生成模型

像素、模式，但无诗意：像人类一样看世界

构建用于定位诊断协作的眼科多模态LLM通过临床认知链推理

HySafe-AI：AI系统混合安全架构分析框架：案例研究

斑马-CoT：一种交叉视觉语言推理数据集

基于视觉-语言慢思考的半离策略强化学习

上采样关键区域：面向加速扩散变换器的区域自适应潜在采样

《MegaScience：推动科学推理的训练后数据集前沿》

Step-Audio 2 技术报告

超越上下文限制：用于长时程推理的潜意识线索

前沿人工智能风险管理框架实践：风险分析技术报告

具有不确定性感知的知识转换器在多智能体强化学习中的对等能源交易研究

无需人类参与：自主高质量图像编辑三元组挖掘

基于正则化分数蒸馏采样的 3D 高斯点云中鲁棒的 3D 掩码部分级编辑

Command Palette

论文

Command Palette

论文

Command Palette

论文