HyperAI

Main

GPU

Console
Studio
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Support Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Main

GPU

Console
Studio
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Support Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

Frontier AI Risk Management Framework in Practice: A Risk Analysis Technical Report v1.5

Frontier AI Risk Management Framework in Practice: A Risk Analysis Technical Report v1.5

Dongrui Liu, Yi Yu, Jie Zhang, et al.

Unified Latents (UL): How to train your latents

Unified Latents (UL): How to train your latents

Diffusion Model

Image Generation

Jonathan Heek, Emiel Hoogeboom, Thomas Mensink, et al.

Mobile-Agent-v3.5: Multi-platform Fundamental GUI Agents

Haiyang Xu, Xi Zhang, Haowei Liu, et al.

SpargeAttention2: Trainable Sparse Attention via Hybrid Top-k+Top-p Masking and Distillation Fine-Tuning

Diffusion Model

Jintao Zhang, Kai Jiang, Chendong Xiang, et al.

AutoWebWorld: Synthesizing Infinite Verifiable Web Environments via Finite State Machines

Yifan Wu, Yiran Peng, Yiyu Chen, et al.

Bounded Model Checking for Unbounded Client Server Systems

Ramchandra Phawade, Tephilla Prince, S. Sheerazuddin

How Much Reasoning Do Retrieval-Augmented Models Add beyond LLMs? A Benchmarking Framework for Multi-Hop Inference over Hybrid Knowledge

Retrieval-Augmented Generation

Junhong Lin, Bing Zhang, Song Wang, et al.

The Vision Wormhole: Latent-Space Communication in Heterogeneous Multi-Agent Systems

Multimodal Representation

Xiaoze Liu, Ruowang Zhang, Weichen Yu, et al.

Panini: Continual Learning in Token Space via Structured Memory

Retrieval-Augmented Generation

Intelligent Question Answering

Shreyas Rajesh, Pavan Holur, Mehmet Yigit Turali, et al.

ResearchGym: Evaluating Language Model Agents on Real-World AI Research

Aniketh Garikaparthi, Manasi Patwardhan, Arman Cohan

Learning to Configure Agentic AI Systems

Aditya Taparia, Som Sagar, Ransalu Senanayake

Does Socialization Emerge in AI Agent Society? A Case Study of Moltbook

Ming Li, Xirui Li, Tianyi Zhou

Sanity Checks for Sparse Autoencoders: Do SAEs Beat Random Baselines?

Anton Korznikov, Andrey Galichin, Alexey Dontsov, et al.

SkillsBench: Benchmarking How Well Agent Skills Work Across Diverse Tasks

Xiangyi Li, Wenbo Chen, Yimin Liu, et al.

GLM-5: from Vibe Coding to Agentic Engineering

Code Generation

GLM-5 Team, Aohan Zeng, Xin Lv, et al.

BitDance: Scaling Autoregressive Generative Models with Binary Tokens

Image Generation

Diffusion Model

Yuang Ai, Jiaming Han, Shaobin Zhuang, et al.

REDSearcher: A Scalable and Cost-Efficient Framework for Long-Horizon Search Agents

Zheng Chu, Xiao Wang, Jack Hong, et al.

Qute: Towards Quantum-Native Database

Retrieval-Augmented Generation

Muzhi Chen, Xuanhe Zhou, Wei Zhou, et al.

InnoEval: On Research Idea Evaluation as a Knowledge-Grounded, Multi-Perspective Reasoning Problem

Retrieval-Augmented Generation

Shuofei Qiao, Yunxiang Wei, Xuehai Wang, et al.

Query as Anchor: Scenario-Adaptive User Representation via Large Language Model

Multimodal Representation

Jiahao Yuan, Yike Xu, Jinyong Wen, et al.

SemanticMoments: Training-Free Motion Similarity via Third Moment Features

Video Understanding

Multimodal Representation

Saar Huberman, Kfir Goldberg, Or Patashnik, et al.

RLinf-Co: Reinforcement Learning-Based Sim-Real Co-Training for VLA Models

Reinforcement Learning

Supervised Fine-Tuning

Liangzhi Shi, Shuaihang Chen, Feng Gao, et al.

ABot-M0: VLA Foundation Model for Robotic Manipulation with Action Manifold Learning

Yandan Yang, Shuang Zeng, Tong Lin, et al.

What does RL improve for Visual Reasoning? A Frankenstein-Style Analysis

Supervised Fine-Tuning

Xirui Li, Ming Li, Tianyi Zhou

MedXIAOHE: A Comprehensive Recipe for Building Medical MLLMs

Intelligent Question Answering

Baorong Shi, Bo Cui, Boyuan Jiang, et al.

Zooming without Zooming: Region-to-Image Distillation for Fine-Grained Multimodal Perception

Visual Question Answering

Lai Wei, Liangbo He, Jun Lan, et al.

Less is Enough: Synthesizing Diverse Data in Feature Space of LLMs

Supervised Fine-Tuning

Zhongzhi Li, Xuansheng Wu, Yijiang Li, et al.

GigaBrain-0.5M*: a VLA That Learns From World Model-Based Reinforcement Learning

GigaBrain Team, Boyuan Wang, Chaojun Ni, et al.

MOSS-Audio-Tokenizer: Scaling Audio Tokenizers for Future Audio Foundation Models

Audio and Speech Processing

Yitian Gong, Kuangwei Chen, Zhaoye Fei, et al.

Learning beyond Teacher: Generalized On-Policy Distillation with Reward Extrapolation

Reinforcement Learning

Wenkai Yang, Weijie Liu, Ruobing Xie, et al.

DeepGen 1.0: A Lightweight Unified Multimodal Model for Advancing Image Generation and Editing

Diffusion Model

Dianyi Wang, Ruihang Li, Feng Han, et al.

Composition-RL: Compose Your Verifiable Prompts for Reinforcement Learning of Large Language Models

Reinforcement Learning

Intelligent Question Answering

Xin Xu, Clive Bai, Kai Yang, et al.

Frontier AI Risk Management Framework in Practice: A Risk Analysis Technical Report v1.5

Frontier AI Risk Management Framework in Practice: A Risk Analysis Technical Report v1.5

Dongrui Liu, Yi Yu, Jie Zhang, et al.

Unified Latents (UL): How to train your latents

Unified Latents (UL): How to train your latents

Diffusion Model

Image Generation

Jonathan Heek, Emiel Hoogeboom, Thomas Mensink, et al.

Mobile-Agent-v3.5: Multi-platform Fundamental GUI Agents

Haiyang Xu, Xi Zhang, Haowei Liu, et al.

SpargeAttention2: Trainable Sparse Attention via Hybrid Top-k+Top-p Masking and Distillation Fine-Tuning

Diffusion Model

Jintao Zhang, Kai Jiang, Chendong Xiang, et al.

AutoWebWorld: Synthesizing Infinite Verifiable Web Environments via Finite State Machines

Yifan Wu, Yiran Peng, Yiyu Chen, et al.

Bounded Model Checking for Unbounded Client Server Systems

Ramchandra Phawade, Tephilla Prince, S. Sheerazuddin

How Much Reasoning Do Retrieval-Augmented Models Add beyond LLMs? A Benchmarking Framework for Multi-Hop Inference over Hybrid Knowledge

Retrieval-Augmented Generation

Junhong Lin, Bing Zhang, Song Wang, et al.

The Vision Wormhole: Latent-Space Communication in Heterogeneous Multi-Agent Systems

Multimodal Representation

Xiaoze Liu, Ruowang Zhang, Weichen Yu, et al.

Panini: Continual Learning in Token Space via Structured Memory

Retrieval-Augmented Generation

Intelligent Question Answering

Shreyas Rajesh, Pavan Holur, Mehmet Yigit Turali, et al.

ResearchGym: Evaluating Language Model Agents on Real-World AI Research

Aniketh Garikaparthi, Manasi Patwardhan, Arman Cohan

Learning to Configure Agentic AI Systems

Aditya Taparia, Som Sagar, Ransalu Senanayake

Does Socialization Emerge in AI Agent Society? A Case Study of Moltbook

Ming Li, Xirui Li, Tianyi Zhou

Sanity Checks for Sparse Autoencoders: Do SAEs Beat Random Baselines?

Anton Korznikov, Andrey Galichin, Alexey Dontsov, et al.

SkillsBench: Benchmarking How Well Agent Skills Work Across Diverse Tasks

Xiangyi Li, Wenbo Chen, Yimin Liu, et al.

GLM-5: from Vibe Coding to Agentic Engineering

Code Generation

GLM-5 Team, Aohan Zeng, Xin Lv, et al.

BitDance: Scaling Autoregressive Generative Models with Binary Tokens

Image Generation

Diffusion Model

Yuang Ai, Jiaming Han, Shaobin Zhuang, et al.

REDSearcher: A Scalable and Cost-Efficient Framework for Long-Horizon Search Agents

Zheng Chu, Xiao Wang, Jack Hong, et al.

Qute: Towards Quantum-Native Database

Retrieval-Augmented Generation

Muzhi Chen, Xuanhe Zhou, Wei Zhou, et al.

InnoEval: On Research Idea Evaluation as a Knowledge-Grounded, Multi-Perspective Reasoning Problem

Retrieval-Augmented Generation

Shuofei Qiao, Yunxiang Wei, Xuehai Wang, et al.

Query as Anchor: Scenario-Adaptive User Representation via Large Language Model

Multimodal Representation

Jiahao Yuan, Yike Xu, Jinyong Wen, et al.

SemanticMoments: Training-Free Motion Similarity via Third Moment Features

Video Understanding

Multimodal Representation

Saar Huberman, Kfir Goldberg, Or Patashnik, et al.

RLinf-Co: Reinforcement Learning-Based Sim-Real Co-Training for VLA Models

Reinforcement Learning

Supervised Fine-Tuning

Liangzhi Shi, Shuaihang Chen, Feng Gao, et al.

ABot-M0: VLA Foundation Model for Robotic Manipulation with Action Manifold Learning

Yandan Yang, Shuang Zeng, Tong Lin, et al.

What does RL improve for Visual Reasoning? A Frankenstein-Style Analysis

Supervised Fine-Tuning

Xirui Li, Ming Li, Tianyi Zhou

MedXIAOHE: A Comprehensive Recipe for Building Medical MLLMs

Intelligent Question Answering

Baorong Shi, Bo Cui, Boyuan Jiang, et al.

Zooming without Zooming: Region-to-Image Distillation for Fine-Grained Multimodal Perception

Visual Question Answering

Lai Wei, Liangbo He, Jun Lan, et al.

Less is Enough: Synthesizing Diverse Data in Feature Space of LLMs

Supervised Fine-Tuning

Zhongzhi Li, Xuansheng Wu, Yijiang Li, et al.

GigaBrain-0.5M*: a VLA That Learns From World Model-Based Reinforcement Learning

GigaBrain Team, Boyuan Wang, Chaojun Ni, et al.

MOSS-Audio-Tokenizer: Scaling Audio Tokenizers for Future Audio Foundation Models

Audio and Speech Processing

Yitian Gong, Kuangwei Chen, Zhaoye Fei, et al.

Learning beyond Teacher: Generalized On-Policy Distillation with Reward Extrapolation

Reinforcement Learning

Wenkai Yang, Weijie Liu, Ruobing Xie, et al.

DeepGen 1.0: A Lightweight Unified Multimodal Model for Advancing Image Generation and Editing

Diffusion Model

Dianyi Wang, Ruihang Li, Feng Han, et al.

Composition-RL: Compose Your Verifiable Prompts for Reinforcement Learning of Large Language Models

Reinforcement Learning

Intelligent Question Answering

Xin Xu, Clive Bai, Kai Yang, et al.

Mobile-Agent-v3.5: Multi-platform Fundamental GUI Agents

SpargeAttention2: Trainable Sparse Attention via Hybrid Top-k+Top-p Masking and Distillation Fine-Tuning

AutoWebWorld: Synthesizing Infinite Verifiable Web Environments via Finite State Machines

Bounded Model Checking for Unbounded Client Server Systems

How Much Reasoning Do Retrieval-Augmented Models Add beyond LLMs? A Benchmarking Framework for Multi-Hop Inference over Hybrid Knowledge

The Vision Wormhole: Latent-Space Communication in Heterogeneous Multi-Agent Systems

Panini: Continual Learning in Token Space via Structured Memory

ResearchGym: Evaluating Language Model Agents on Real-World AI Research

Learning to Configure Agentic AI Systems

Does Socialization Emerge in AI Agent Society? A Case Study of Moltbook

Sanity Checks for Sparse Autoencoders: Do SAEs Beat Random Baselines?

SkillsBench: Benchmarking How Well Agent Skills Work Across Diverse Tasks

GLM-5: from Vibe Coding to Agentic Engineering

BitDance: Scaling Autoregressive Generative Models with Binary Tokens

REDSearcher: A Scalable and Cost-Efficient Framework for Long-Horizon Search Agents

Qute: Towards Quantum-Native Database

InnoEval: On Research Idea Evaluation as a Knowledge-Grounded, Multi-Perspective Reasoning Problem

Query as Anchor: Scenario-Adaptive User Representation via Large Language Model

SemanticMoments: Training-Free Motion Similarity via Third Moment Features

RLinf-Co: Reinforcement Learning-Based Sim-Real Co-Training for VLA Models

ABot-M0: VLA Foundation Model for Robotic Manipulation with Action Manifold Learning

What does RL improve for Visual Reasoning? A Frankenstein-Style Analysis

MedXIAOHE: A Comprehensive Recipe for Building Medical MLLMs

Zooming without Zooming: Region-to-Image Distillation for Fine-Grained Multimodal Perception

Less is Enough: Synthesizing Diverse Data in Feature Space of LLMs

GigaBrain-0.5M*: a VLA That Learns From World Model-Based Reinforcement Learning

MOSS-Audio-Tokenizer: Scaling Audio Tokenizers for Future Audio Foundation Models

Learning beyond Teacher: Generalized On-Policy Distillation with Reward Extrapolation

DeepGen 1.0: A Lightweight Unified Multimodal Model for Advancing Image Generation and Editing

Composition-RL: Compose Your Verifiable Prompts for Reinforcement Learning of Large Language Models

Mobile-Agent-v3.5: Multi-platform Fundamental GUI Agents

SpargeAttention2: Trainable Sparse Attention via Hybrid Top-k+Top-p Masking and Distillation Fine-Tuning

AutoWebWorld: Synthesizing Infinite Verifiable Web Environments via Finite State Machines

Bounded Model Checking for Unbounded Client Server Systems

How Much Reasoning Do Retrieval-Augmented Models Add beyond LLMs? A Benchmarking Framework for Multi-Hop Inference over Hybrid Knowledge

The Vision Wormhole: Latent-Space Communication in Heterogeneous Multi-Agent Systems

Panini: Continual Learning in Token Space via Structured Memory

ResearchGym: Evaluating Language Model Agents on Real-World AI Research

Learning to Configure Agentic AI Systems

Does Socialization Emerge in AI Agent Society? A Case Study of Moltbook

Sanity Checks for Sparse Autoencoders: Do SAEs Beat Random Baselines?

SkillsBench: Benchmarking How Well Agent Skills Work Across Diverse Tasks

GLM-5: from Vibe Coding to Agentic Engineering

BitDance: Scaling Autoregressive Generative Models with Binary Tokens

REDSearcher: A Scalable and Cost-Efficient Framework for Long-Horizon Search Agents

Qute: Towards Quantum-Native Database

InnoEval: On Research Idea Evaluation as a Knowledge-Grounded, Multi-Perspective Reasoning Problem

Query as Anchor: Scenario-Adaptive User Representation via Large Language Model

SemanticMoments: Training-Free Motion Similarity via Third Moment Features

RLinf-Co: Reinforcement Learning-Based Sim-Real Co-Training for VLA Models

ABot-M0: VLA Foundation Model for Robotic Manipulation with Action Manifold Learning

What does RL improve for Visual Reasoning? A Frankenstein-Style Analysis

MedXIAOHE: A Comprehensive Recipe for Building Medical MLLMs

Zooming without Zooming: Region-to-Image Distillation for Fine-Grained Multimodal Perception

Less is Enough: Synthesizing Diverse Data in Feature Space of LLMs

GigaBrain-0.5M*: a VLA That Learns From World Model-Based Reinforcement Learning

MOSS-Audio-Tokenizer: Scaling Audio Tokenizers for Future Audio Foundation Models

Learning beyond Teacher: Generalized On-Policy Distillation with Reward Extrapolation

DeepGen 1.0: A Lightweight Unified Multimodal Model for Advancing Image Generation and Editing

Composition-RL: Compose Your Verifiable Prompts for Reinforcement Learning of Large Language Models