HyperAI

Main

GPU

Console
Studio
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Support Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Main

GPU

Console
Studio
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Support Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

SkillOpt: Executive Strategy for Self-Evolving Agent Skills

SkillOpt: Executive Strategy for Self-Evolving Agent Skills

Yifan Yang, Ziyang Gong, Weiquan Huang, et al.

CVEvolve: Autonomous Algorithm Discovery for Unstructured Scientific Data Processing

CVEvolve: Autonomous Algorithm Discovery for Unstructured Scientific Data Processing

Image Processing

Ming Du, Xiangyu Yin, Yanqi Luo, et al.

Poly-EPO: Training Exploratory Reasoning Models

Reinforcement Learning

Ifdita Hasan Orney, Jubayer Ibn Hamid, Shreya S Ramanujam, et al.

MEMO: Memory as a Model

Retrieval-Augmented Generation

Ryan Wei Heng Quek, Sanghyuk Lee, Alfred Wei Lun Leong, et al.

ACC: Compiling Agent Trajectories for Long-Context Training

Supervised Fine-Tuning

Qisheng Su, Zhen Fang, Shiting Huang, et al.

Full Attention Strikes Back: Transferring Full Attention into Sparse within Hundred Training Steps

Yanke Zhou, Yiduo Li, Hanlin Tang, et al.

$π$-Bench: Evaluating Proactive Personal Assistant Agents in Long-Horizon Workflows

Haoran Zhang, Luxin Xu, Zhilin Wang, et al.

Perception or Prejudice: Can MLLMs Go Beyond First Impressions of Personality?

Caixin Kang, Tianyu Yan, Sitong Gong, et al.

TransitLM: A Large-Scale Dataset and Benchmark for Map-Free Transit Route Generation

Hanyu Guo, Jiedong Yang, Chao Chen, et al.

DelTA: Discriminative Token Credit Assignment for Reinforcement Learning from Verifiable Rewards

Reinforcement Learning

Kaiyi Zhang, Wei Wu, Yankai Lin

Interactive Evaluation Requires a Design Science

Keyang Xuan, Peiyang Song, Pan Lu, et al.

ESI-BENCH: Towards Embodied Spatial Intelligence that Closes the Perception-Action Loop

Embodied Intelligence

Yining Hong, Jiageng Liu, Han Yin, et al.

Comparative Analysis of Military Detection Using Drone Imagery Across Multiple Visual Spectrums

Object Detection

Sourov Roy Shuvo, Prajwal Panth, Rajesh Chowdhury, et al.

Automated ICD Classification of Psychiatric Diagnoses: From Classical NLP to Large Language Models

Natural Language Processing

Fernando Ortega, Raúl Lara-Cabrera, Jorge Dueñas-Lerín, et al.

Coordinated Optimal Power Quality Management in Distribution Systems Using The Residual Capacity of Community IBRs

Text Generation

Tiantian Ji, Pengfeng Lin, Miao Zhu, et al.

EllipseLIO: Adaptive LiDAR Inertial Odometry with an Ellipsoid Representation

3D Machine Vision

Rowan Border, Margarita Chli

SMoA: Spectrum Modulation Adapter for Parameter-Efficient Fine-Tuning

Yongkang Liu, Xing Li, Mengjie Zhao, et al.

Detecting Trojaned DNNs via Spectral Regression Analysis

Samuele Pasini, Jinhan Kim, Paolo Tonella

The Illusion of Thinking: Understanding the Strengths and Limitations of Reasoning Models via the Lens of Problem Complexity

Parshin Shojae, Iman Mirzadeh, Keivan Alizadeh, et al.

Generative Recursive Reasoning

Text Generation

Junyeob Baek, Mingyu Jo, Minsu Kim, et al.

Safety Pretraining: Toward the Next Generation of Safe AI

Pratyush Maini, Sachin Goyal, Dylan Sam, et al.

RubricEM: Meta-RL with Rubric-guided Policy Decomposition beyond Verifiable Rewards

Reinforcement Learning

Gaotang Li, Bhavana Dalvi Mishra, Zifeng Wang, et al.

When Vision Speaks for Sound

Video Understanding

Xiaofei Wen, Wenjie Jacky Mo, Xingyu Fu, et al.

AutoResearchClaw: Self-Reinforcing Autonomous Research with Human-AI Collaboration

Jiaqi Liu, Shi Qiu, Mairui Li, et al.

Process Rewards with Learned Reliability

Reinforcement Learning

Jinyuan Li, Langlin Huang, Chengsong Huang, et al.

GoLongRL: Capability-Oriented Long Context Reinforcement Learning with Multitask Alignment

Reinforcement Learning

Minxuan Lv, Tiehua Mei, Tanlong Du, et al.

OpenComputer: Verifiable Software Worlds for Computer-Use Agents

Jinbiao Wei, Qianran Ma, Yilun Zhao, et al.

Anti-Self-Distillation for Reasoning RL via Pointwise Mutual Information

Reinforcement Learning

Guobin Shen, Xiang Cheng, Chenxiao Zhao, et al.

Targeted Neuron Modulation via Contrastive Pair Search

Supervised Fine-Tuning

Sam Herring, Jake Naviasky, Karan Malhotra

Continuous Diffusion Scales Competitively with Discrete Diffusion for Language

Diffusion Model

Text Generation

Zhihan Yang, Wei Guo, Shuibai Zhang, et al.

KVPO: ODE-Native GRPO for Autoregressive Video Alignment via KV Semantic Exploration

Video Generation

Ruicheng Zhang, Kaixi Cong, Jun Zhou, et al.

Code-as-Room: Generating 3D Rooms from Top-Down View Images via Agentic Code Synthesis

Yixuan Yang, Zhen Luo, Wanshui Gan, et al.

SkillOpt: Executive Strategy for Self-Evolving Agent Skills

SkillOpt: Executive Strategy for Self-Evolving Agent Skills

Yifan Yang, Ziyang Gong, Weiquan Huang, et al.

CVEvolve: Autonomous Algorithm Discovery for Unstructured Scientific Data Processing

CVEvolve: Autonomous Algorithm Discovery for Unstructured Scientific Data Processing

Image Processing

Ming Du, Xiangyu Yin, Yanqi Luo, et al.

Poly-EPO: Training Exploratory Reasoning Models

Reinforcement Learning

Ifdita Hasan Orney, Jubayer Ibn Hamid, Shreya S Ramanujam, et al.

MEMO: Memory as a Model

Retrieval-Augmented Generation

Ryan Wei Heng Quek, Sanghyuk Lee, Alfred Wei Lun Leong, et al.

ACC: Compiling Agent Trajectories for Long-Context Training

Supervised Fine-Tuning

Qisheng Su, Zhen Fang, Shiting Huang, et al.

Full Attention Strikes Back: Transferring Full Attention into Sparse within Hundred Training Steps

Yanke Zhou, Yiduo Li, Hanlin Tang, et al.

$π$-Bench: Evaluating Proactive Personal Assistant Agents in Long-Horizon Workflows

Haoran Zhang, Luxin Xu, Zhilin Wang, et al.

Perception or Prejudice: Can MLLMs Go Beyond First Impressions of Personality?

Caixin Kang, Tianyu Yan, Sitong Gong, et al.

TransitLM: A Large-Scale Dataset and Benchmark for Map-Free Transit Route Generation

Hanyu Guo, Jiedong Yang, Chao Chen, et al.

DelTA: Discriminative Token Credit Assignment for Reinforcement Learning from Verifiable Rewards

Reinforcement Learning

Kaiyi Zhang, Wei Wu, Yankai Lin

Interactive Evaluation Requires a Design Science

Keyang Xuan, Peiyang Song, Pan Lu, et al.

ESI-BENCH: Towards Embodied Spatial Intelligence that Closes the Perception-Action Loop

Embodied Intelligence

Yining Hong, Jiageng Liu, Han Yin, et al.

Comparative Analysis of Military Detection Using Drone Imagery Across Multiple Visual Spectrums

Object Detection

Sourov Roy Shuvo, Prajwal Panth, Rajesh Chowdhury, et al.

Automated ICD Classification of Psychiatric Diagnoses: From Classical NLP to Large Language Models

Natural Language Processing

Fernando Ortega, Raúl Lara-Cabrera, Jorge Dueñas-Lerín, et al.

Coordinated Optimal Power Quality Management in Distribution Systems Using The Residual Capacity of Community IBRs

Text Generation

Tiantian Ji, Pengfeng Lin, Miao Zhu, et al.

EllipseLIO: Adaptive LiDAR Inertial Odometry with an Ellipsoid Representation

3D Machine Vision

Rowan Border, Margarita Chli

SMoA: Spectrum Modulation Adapter for Parameter-Efficient Fine-Tuning

Yongkang Liu, Xing Li, Mengjie Zhao, et al.

Detecting Trojaned DNNs via Spectral Regression Analysis

Samuele Pasini, Jinhan Kim, Paolo Tonella

The Illusion of Thinking: Understanding the Strengths and Limitations of Reasoning Models via the Lens of Problem Complexity

Parshin Shojae, Iman Mirzadeh, Keivan Alizadeh, et al.

Generative Recursive Reasoning

Text Generation

Junyeob Baek, Mingyu Jo, Minsu Kim, et al.

Safety Pretraining: Toward the Next Generation of Safe AI

Pratyush Maini, Sachin Goyal, Dylan Sam, et al.

RubricEM: Meta-RL with Rubric-guided Policy Decomposition beyond Verifiable Rewards

Reinforcement Learning

Gaotang Li, Bhavana Dalvi Mishra, Zifeng Wang, et al.

When Vision Speaks for Sound

Video Understanding

Xiaofei Wen, Wenjie Jacky Mo, Xingyu Fu, et al.

AutoResearchClaw: Self-Reinforcing Autonomous Research with Human-AI Collaboration

Jiaqi Liu, Shi Qiu, Mairui Li, et al.

Process Rewards with Learned Reliability

Reinforcement Learning

Jinyuan Li, Langlin Huang, Chengsong Huang, et al.

GoLongRL: Capability-Oriented Long Context Reinforcement Learning with Multitask Alignment

Reinforcement Learning

Minxuan Lv, Tiehua Mei, Tanlong Du, et al.

OpenComputer: Verifiable Software Worlds for Computer-Use Agents

Jinbiao Wei, Qianran Ma, Yilun Zhao, et al.

Anti-Self-Distillation for Reasoning RL via Pointwise Mutual Information

Reinforcement Learning

Guobin Shen, Xiang Cheng, Chenxiao Zhao, et al.

Targeted Neuron Modulation via Contrastive Pair Search

Supervised Fine-Tuning

Sam Herring, Jake Naviasky, Karan Malhotra

Continuous Diffusion Scales Competitively with Discrete Diffusion for Language

Diffusion Model

Text Generation

Zhihan Yang, Wei Guo, Shuibai Zhang, et al.

KVPO: ODE-Native GRPO for Autoregressive Video Alignment via KV Semantic Exploration

Video Generation

Ruicheng Zhang, Kaixi Cong, Jun Zhou, et al.

Code-as-Room: Generating 3D Rooms from Top-Down View Images via Agentic Code Synthesis

Yixuan Yang, Zhen Luo, Wanshui Gan, et al.

Poly-EPO: Training Exploratory Reasoning Models

MEMO: Memory as a Model

ACC: Compiling Agent Trajectories for Long-Context Training

Full Attention Strikes Back: Transferring Full Attention into Sparse within Hundred Training Steps

$π$ -Bench: Evaluating Proactive Personal Assistant Agents in Long-Horizon Workflows

Perception or Prejudice: Can MLLMs Go Beyond First Impressions of Personality?

TransitLM: A Large-Scale Dataset and Benchmark for Map-Free Transit Route Generation

DelTA: Discriminative Token Credit Assignment for Reinforcement Learning from Verifiable Rewards

Interactive Evaluation Requires a Design Science

ESI-BENCH: Towards Embodied Spatial Intelligence that Closes the Perception-Action Loop

Comparative Analysis of Military Detection Using Drone Imagery Across Multiple Visual Spectrums

Automated ICD Classification of Psychiatric Diagnoses: From Classical NLP to Large Language Models

Coordinated Optimal Power Quality Management in Distribution Systems Using The Residual Capacity of Community IBRs

EllipseLIO: Adaptive LiDAR Inertial Odometry with an Ellipsoid Representation

SMoA: Spectrum Modulation Adapter for Parameter-Efficient Fine-Tuning

Detecting Trojaned DNNs via Spectral Regression Analysis

The Illusion of Thinking: Understanding the Strengths and Limitations of Reasoning Models via the Lens of Problem Complexity

Generative Recursive Reasoning

Safety Pretraining: Toward the Next Generation of Safe AI

RubricEM: Meta-RL with Rubric-guided Policy Decomposition beyond Verifiable Rewards

When Vision Speaks for Sound

AutoResearchClaw: Self-Reinforcing Autonomous Research with Human-AI Collaboration

Process Rewards with Learned Reliability

GoLongRL: Capability-Oriented Long Context Reinforcement Learning with Multitask Alignment

OpenComputer: Verifiable Software Worlds for Computer-Use Agents

Anti-Self-Distillation for Reasoning RL via Pointwise Mutual Information

Targeted Neuron Modulation via Contrastive Pair Search

Continuous Diffusion Scales Competitively with Discrete Diffusion for Language

KVPO: ODE-Native GRPO for Autoregressive Video Alignment via KV Semantic Exploration

Code-as-Room: Generating 3D Rooms from Top-Down View Images via Agentic Code Synthesis

Poly-EPO: Training Exploratory Reasoning Models

MEMO: Memory as a Model

ACC: Compiling Agent Trajectories for Long-Context Training

Full Attention Strikes Back: Transferring Full Attention into Sparse within Hundred Training Steps

$π$ -Bench: Evaluating Proactive Personal Assistant Agents in Long-Horizon Workflows

Perception or Prejudice: Can MLLMs Go Beyond First Impressions of Personality?

TransitLM: A Large-Scale Dataset and Benchmark for Map-Free Transit Route Generation

DelTA: Discriminative Token Credit Assignment for Reinforcement Learning from Verifiable Rewards

Interactive Evaluation Requires a Design Science

ESI-BENCH: Towards Embodied Spatial Intelligence that Closes the Perception-Action Loop

Comparative Analysis of Military Detection Using Drone Imagery Across Multiple Visual Spectrums

Automated ICD Classification of Psychiatric Diagnoses: From Classical NLP to Large Language Models

Coordinated Optimal Power Quality Management in Distribution Systems Using The Residual Capacity of Community IBRs

EllipseLIO: Adaptive LiDAR Inertial Odometry with an Ellipsoid Representation

SMoA: Spectrum Modulation Adapter for Parameter-Efficient Fine-Tuning

Detecting Trojaned DNNs via Spectral Regression Analysis

The Illusion of Thinking: Understanding the Strengths and Limitations of Reasoning Models via the Lens of Problem Complexity

Generative Recursive Reasoning

Safety Pretraining: Toward the Next Generation of Safe AI

RubricEM: Meta-RL with Rubric-guided Policy Decomposition beyond Verifiable Rewards

When Vision Speaks for Sound

AutoResearchClaw: Self-Reinforcing Autonomous Research with Human-AI Collaboration

Process Rewards with Learned Reliability

GoLongRL: Capability-Oriented Long Context Reinforcement Learning with Multitask Alignment

OpenComputer: Verifiable Software Worlds for Computer-Use Agents

Anti-Self-Distillation for Reasoning RL via Pointwise Mutual Information

Targeted Neuron Modulation via Contrastive Pair Search

Continuous Diffusion Scales Competitively with Discrete Diffusion for Language

KVPO: ODE-Native GRPO for Autoregressive Video Alignment via KV Semantic Exploration

Code-as-Room: Generating 3D Rooms from Top-Down View Images via Agentic Code Synthesis