HyperAI

Main

GPU

Console
Studio
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Support Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Main

GPU

Console
Studio
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Support Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

Rethinking the Evaluation of Harness Evolution for Agents

Rethinking the Evaluation of Harness Evolution for Agents

Yike Wang, Huaisheng Zhu, Zhengyu Hu, et al.

Ring-Zero: Scaling Zero RL to a Trillion Parameters for Emergent Reasoning

Ring-Zero: Scaling Zero RL to a Trillion Parameters for Emergent Reasoning

Reinforcement Learning

Xinyu Tang, Gangqiang Cao, Yurou Liu, et al.

Bridging the Gap Between Latent and Explicit Reasoning with Looped Transformers

Ying Fan, Anej Svete, Kangwook Lee

Towards Autonomous and Auditable Medical Imaging Model Development

Medical Imaging

Shengyuan Liu, Jia-Xuan Jiang, Boyun Zheng, et al.

MUSCRIPTOR: AN OPEN MODEL FOR MULTI-INSTRUMENT MUSIC TRANSCRIPTION

Audio Recognition

Audio and Speech Processing

Simon Rouard, Carl-Johann Simon-Gabriel, Michael Krause

Principled Analysis of Deep Reinforcement Learning Evaluation and Design Paradigms

Reinforcement Learning

Know Before Fix: QA-Driven Repository Knowledge Acquisition for Software Issue Resolution

Code Generation

Intelligent Question Answering

Haotian Lin, Silin Chen, Xiaodong Gu, et al.

Blind-Spots-Bench: Evaluating Blind Spots in Multimodal Models

Matteo Santelmo, Xiuying Wei, Israa Fakih, et al.

Read It Back: Pretrained MLLMs Are Zero-Shot Reward Models for Text-to-Image Generation

Diffusion Model

Runhui Huang, Qihui Zhang, Zhe Liu, et al.

The Role of Rigor in Artificial Intelligence

Artificial Intelligence

Proxy Exploration and Reusable Guidance: A Modular LLM Post-Training Paradigm via Proxy-Guided Update Signals

Supervised Fine-Tuning

Daocheng Fu, Rong Wu, Yu Yang, et al.

Towards Efficient Convolutional Neural Network for Embedded Hardware via Multi-Dimensional Pruning

Convolutional Neural Network

Hao Kong, Di Liu, Xiangzhong Luo, et al.

LLM-Guided Program Evolution for Targeted Black-Box Attacks on Perceptual Hash Algorithms

Image Processing

Aleksei S. Krylov, Denis S. Rakhov, Veronica Veselova, et al.

Are LLMs ready for HARDCHOICES?

Preference Modeling

Dmitry Nikolaev

Prezta: Provable Remote Execution of Zero-Trust Authorization using SNARKs

Zhongjing Wei, Yupeng Zhang, Osaid Muhammad Ameer, et al.

Score-Only Distillation for Compact Dense Retrieval

Kirill Dubovikov, Martin Takáč, Salem Lahlou

FAIR GraphRAG: A Retrieval-Augmented Generation Approach for Semantic Data Analysis

Retrieval-Augmented Generation

Marlena Fluh, Soo-Yon Kim, Carolin Victoria Schneider, et al.

ManiScope: LLM-Assisted Visual Analytics of Cryptocurrency Manipulation Risk

Xiaolin Wen, Feng Liang, Yuanye Ma, et al.

Event-based Neural Decoding for Neuroprosthetic Motor Control

Khaleelulla Khan Nazeer, Sirine Arfa, Matthias Jobst, et al.

Unlocking Every Expert in Domain-Specific Training

Supervised Fine-Tuning

Xuefeng Li, Pengfei Liu

EdgeBench: Unveiling Scaling Laws of Learning from Real-World Environments

Reinforcement Learning

Deyao Zhu, Xin Zhou, Shengling Qin, et al.

ARDY: Autoregressive Diffusion with Hybrid Representation for Interactive Human Motion Generation

Diffusion Model

Kaifeng Zhao, Mathis Petrovich, Haotian Zhang, et al.

PithTrain: A Compact and Agent-Native MoE Training System

Ruihang Lai, Hao Kang, Haozhan Tang, et al.

Language Models Need Sleep: Learning to Self-Modify and Consolidate Memories

Reinforcement Learning

Ali Behrouz, Farnoosh Hashemi, Adel Javanmard, et al.

HunyuanOCR-1.5: Making Lightweight OCR VLMs Faster and Better

Document Understanding

Gengluo Li, Xingyu Wan, Shangpin Peng, et al.

From RGB Generation to Dense Field Readout: Pixel-Space Dense Prediction with Text-to-Image Models

Diffusion Model

Depth Estimation

Zanyi Wang, Xin Lin, Haodong Li, et al.

KronQ: LLM Quantization via Kronecker-Factored Hessian

Donghyun Lee, Yuhang Li, Ruokai Yin, et al.

Trust Region Policy Distillation

Reinforcement Learning

Zhengpeng Xie, Li Lyna Zhang, Zeke Xie, et al.

Video Generation Models are General-Purpose Vision Learners

Diffusion Model

Letian Wang, Chuhan Zhang, Rishabh Kabra, et al.

Scalable Visual Pretraining for Language Intelligence

Yiming Zhang, Zhonghan Zhao, Wenwei Zhang, et al.

Long-Horizon-Terminal-Bench: Testing the Limits of Agents on Long-Horizon Terminal Tasks with Dense Reward-Based Grading

Zongxia Li, Zhongzhi Li, Yucheng Shi, et al.

LLM-as-a-Tutor: Policy-Aware Prompt Adaptation for Non-Verifiable RL

Reinforcement Learning

Yujin Kim, Namgyu Ho, Sangmin Hwang, et al.

Rethinking the Evaluation of Harness Evolution for Agents

Rethinking the Evaluation of Harness Evolution for Agents

Yike Wang, Huaisheng Zhu, Zhengyu Hu, et al.

Ring-Zero: Scaling Zero RL to a Trillion Parameters for Emergent Reasoning

Ring-Zero: Scaling Zero RL to a Trillion Parameters for Emergent Reasoning

Reinforcement Learning

Xinyu Tang, Gangqiang Cao, Yurou Liu, et al.

Bridging the Gap Between Latent and Explicit Reasoning with Looped Transformers

Ying Fan, Anej Svete, Kangwook Lee

Towards Autonomous and Auditable Medical Imaging Model Development

Medical Imaging

Shengyuan Liu, Jia-Xuan Jiang, Boyun Zheng, et al.

MUSCRIPTOR: AN OPEN MODEL FOR MULTI-INSTRUMENT MUSIC TRANSCRIPTION

Audio Recognition

Audio and Speech Processing

Simon Rouard, Carl-Johann Simon-Gabriel, Michael Krause

Principled Analysis of Deep Reinforcement Learning Evaluation and Design Paradigms

Reinforcement Learning

Know Before Fix: QA-Driven Repository Knowledge Acquisition for Software Issue Resolution

Code Generation

Intelligent Question Answering

Haotian Lin, Silin Chen, Xiaodong Gu, et al.

Blind-Spots-Bench: Evaluating Blind Spots in Multimodal Models

Matteo Santelmo, Xiuying Wei, Israa Fakih, et al.

Read It Back: Pretrained MLLMs Are Zero-Shot Reward Models for Text-to-Image Generation

Diffusion Model

Runhui Huang, Qihui Zhang, Zhe Liu, et al.

The Role of Rigor in Artificial Intelligence

Artificial Intelligence

Proxy Exploration and Reusable Guidance: A Modular LLM Post-Training Paradigm via Proxy-Guided Update Signals

Supervised Fine-Tuning

Daocheng Fu, Rong Wu, Yu Yang, et al.

Towards Efficient Convolutional Neural Network for Embedded Hardware via Multi-Dimensional Pruning

Convolutional Neural Network

Hao Kong, Di Liu, Xiangzhong Luo, et al.

LLM-Guided Program Evolution for Targeted Black-Box Attacks on Perceptual Hash Algorithms

Image Processing

Aleksei S. Krylov, Denis S. Rakhov, Veronica Veselova, et al.

Are LLMs ready for HARDCHOICES?

Preference Modeling

Dmitry Nikolaev

Prezta: Provable Remote Execution of Zero-Trust Authorization using SNARKs

Zhongjing Wei, Yupeng Zhang, Osaid Muhammad Ameer, et al.

Score-Only Distillation for Compact Dense Retrieval

Kirill Dubovikov, Martin Takáč, Salem Lahlou

FAIR GraphRAG: A Retrieval-Augmented Generation Approach for Semantic Data Analysis

Retrieval-Augmented Generation

Marlena Fluh, Soo-Yon Kim, Carolin Victoria Schneider, et al.

ManiScope: LLM-Assisted Visual Analytics of Cryptocurrency Manipulation Risk

Xiaolin Wen, Feng Liang, Yuanye Ma, et al.

Event-based Neural Decoding for Neuroprosthetic Motor Control

Khaleelulla Khan Nazeer, Sirine Arfa, Matthias Jobst, et al.

Unlocking Every Expert in Domain-Specific Training

Supervised Fine-Tuning

Xuefeng Li, Pengfei Liu

EdgeBench: Unveiling Scaling Laws of Learning from Real-World Environments

Reinforcement Learning

Deyao Zhu, Xin Zhou, Shengling Qin, et al.

ARDY: Autoregressive Diffusion with Hybrid Representation for Interactive Human Motion Generation

Diffusion Model

Kaifeng Zhao, Mathis Petrovich, Haotian Zhang, et al.

PithTrain: A Compact and Agent-Native MoE Training System

Ruihang Lai, Hao Kang, Haozhan Tang, et al.

Language Models Need Sleep: Learning to Self-Modify and Consolidate Memories

Reinforcement Learning

Ali Behrouz, Farnoosh Hashemi, Adel Javanmard, et al.

HunyuanOCR-1.5: Making Lightweight OCR VLMs Faster and Better

Document Understanding

Gengluo Li, Xingyu Wan, Shangpin Peng, et al.

From RGB Generation to Dense Field Readout: Pixel-Space Dense Prediction with Text-to-Image Models

Diffusion Model

Depth Estimation

Zanyi Wang, Xin Lin, Haodong Li, et al.

KronQ: LLM Quantization via Kronecker-Factored Hessian

Donghyun Lee, Yuhang Li, Ruokai Yin, et al.

Trust Region Policy Distillation

Reinforcement Learning

Zhengpeng Xie, Li Lyna Zhang, Zeke Xie, et al.

Video Generation Models are General-Purpose Vision Learners

Diffusion Model

Letian Wang, Chuhan Zhang, Rishabh Kabra, et al.

Scalable Visual Pretraining for Language Intelligence

Yiming Zhang, Zhonghan Zhao, Wenwei Zhang, et al.

Long-Horizon-Terminal-Bench: Testing the Limits of Agents on Long-Horizon Terminal Tasks with Dense Reward-Based Grading

Zongxia Li, Zhongzhi Li, Yucheng Shi, et al.

LLM-as-a-Tutor: Policy-Aware Prompt Adaptation for Non-Verifiable RL

Reinforcement Learning

Yujin Kim, Namgyu Ho, Sangmin Hwang, et al.

Bridging the Gap Between Latent and Explicit Reasoning with Looped Transformers

Towards Autonomous and Auditable Medical Imaging Model Development

MUSCRIPTOR: AN OPEN MODEL FOR MULTI-INSTRUMENT MUSIC TRANSCRIPTION

Principled Analysis of Deep Reinforcement Learning Evaluation and Design Paradigms

Know Before Fix: QA-Driven Repository Knowledge Acquisition for Software Issue Resolution

Blind-Spots-Bench: Evaluating Blind Spots in Multimodal Models

Read It Back: Pretrained MLLMs Are Zero-Shot Reward Models for Text-to-Image Generation

The Role of Rigor in Artificial Intelligence

Proxy Exploration and Reusable Guidance: A Modular LLM Post-Training Paradigm via Proxy-Guided Update Signals

Towards Efficient Convolutional Neural Network for Embedded Hardware via Multi-Dimensional Pruning

LLM-Guided Program Evolution for Targeted Black-Box Attacks on Perceptual Hash Algorithms

Are LLMs ready for HARDCHOICES?

Prezta: Provable Remote Execution of Zero-Trust Authorization using SNARKs

Score-Only Distillation for Compact Dense Retrieval

FAIR GraphRAG: A Retrieval-Augmented Generation Approach for Semantic Data Analysis

ManiScope: LLM-Assisted Visual Analytics of Cryptocurrency Manipulation Risk

Event-based Neural Decoding for Neuroprosthetic Motor Control

Unlocking Every Expert in Domain-Specific Training

EdgeBench: Unveiling Scaling Laws of Learning from Real-World Environments

ARDY: Autoregressive Diffusion with Hybrid Representation for Interactive Human Motion Generation

PithTrain: A Compact and Agent-Native MoE Training System

Language Models Need Sleep: Learning to Self-Modify and Consolidate Memories

HunyuanOCR-1.5: Making Lightweight OCR VLMs Faster and Better

From RGB Generation to Dense Field Readout: Pixel-Space Dense Prediction with Text-to-Image Models

KronQ: LLM Quantization via Kronecker-Factored Hessian

Trust Region Policy Distillation

Video Generation Models are General-Purpose Vision Learners

Scalable Visual Pretraining for Language Intelligence

Long-Horizon-Terminal-Bench: Testing the Limits of Agents on Long-Horizon Terminal Tasks with Dense Reward-Based Grading

LLM-as-a-Tutor: Policy-Aware Prompt Adaptation for Non-Verifiable RL

Bridging the Gap Between Latent and Explicit Reasoning with Looped Transformers

Towards Autonomous and Auditable Medical Imaging Model Development

MUSCRIPTOR: AN OPEN MODEL FOR MULTI-INSTRUMENT MUSIC TRANSCRIPTION

Principled Analysis of Deep Reinforcement Learning Evaluation and Design Paradigms

Know Before Fix: QA-Driven Repository Knowledge Acquisition for Software Issue Resolution

Blind-Spots-Bench: Evaluating Blind Spots in Multimodal Models

Read It Back: Pretrained MLLMs Are Zero-Shot Reward Models for Text-to-Image Generation

The Role of Rigor in Artificial Intelligence

Proxy Exploration and Reusable Guidance: A Modular LLM Post-Training Paradigm via Proxy-Guided Update Signals

Towards Efficient Convolutional Neural Network for Embedded Hardware via Multi-Dimensional Pruning

LLM-Guided Program Evolution for Targeted Black-Box Attacks on Perceptual Hash Algorithms

Are LLMs ready for HARDCHOICES?

Prezta: Provable Remote Execution of Zero-Trust Authorization using SNARKs

Score-Only Distillation for Compact Dense Retrieval

FAIR GraphRAG: A Retrieval-Augmented Generation Approach for Semantic Data Analysis

ManiScope: LLM-Assisted Visual Analytics of Cryptocurrency Manipulation Risk

Event-based Neural Decoding for Neuroprosthetic Motor Control

Unlocking Every Expert in Domain-Specific Training

EdgeBench: Unveiling Scaling Laws of Learning from Real-World Environments

ARDY: Autoregressive Diffusion with Hybrid Representation for Interactive Human Motion Generation

PithTrain: A Compact and Agent-Native MoE Training System

Language Models Need Sleep: Learning to Self-Modify and Consolidate Memories

HunyuanOCR-1.5: Making Lightweight OCR VLMs Faster and Better

From RGB Generation to Dense Field Readout: Pixel-Space Dense Prediction with Text-to-Image Models

KronQ: LLM Quantization via Kronecker-Factored Hessian

Trust Region Policy Distillation

Video Generation Models are General-Purpose Vision Learners

Scalable Visual Pretraining for Language Intelligence

Long-Horizon-Terminal-Bench: Testing the Limits of Agents on Long-Horizon Terminal Tasks with Dense Reward-Based Grading

LLM-as-a-Tutor: Policy-Aware Prompt Adaptation for Non-Verifiable RL