HyperAI

Main

GPU

Console
Studio
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Support Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Main

GPU

Console
Studio
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Support Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

Reasoning Models Generate Societies of Thought

Reasoning Models Generate Societies of Thought

Junsol Kim, Shiyang Lai, Nino Scherrer, et al.

A Large-Scale Study on the Development and Issues of Multi-Agent AI Systems

A Large-Scale Study on the Development and Issues of Multi-Agent AI Systems

Daniel Liu, Krishna Upadhyay, Vinaik Chhetri, et al.

ACoT-VLA: Action Chain-of-Thought for Vision-Language-Action Models

Embodied Intelligence

Linqing Zhong, Yi Liu, Yifei Wei, et al.

When Personalization Misleads: Understanding and Mitigating Hallucinations in Personalized LLMs

Intelligent Question Answering

Zhongxiang Sun, Yi Zhan, Chenglei Shen, et al.

RubricHub: A Comprehensive and Highly Discriminative Rubric Dataset via Automated Coarse-to-Fine Generation

Sunzhu Li, Jiale Zhao, Miteto Wei, et al.

Unlocking Implicit Experience: Synthesizing Tool-Use Trajectories from Text

Zhihao Xu, Rumei Li, Jiahuan Li, et al.

The Poisoned Apple Effect: Strategic Manipulation of Mediated Markets via Technology Expansion of AI Agents

Artificial Intelligence

Eilam Shapira, Roi Reichart, Moshe Tennenholtz

Your Group-Relative Advantage Is Biased

Reinforcement Learning

Fengkai Yang, Zherui Chen, Xiaohan Wang, et al.

STEM: Scaling Transformers with Embedding Modules

Ranajoy Sadhukhan, Sheng Cao, Harry Dong, et al.

Lost in the Noise: How Reasoning Models Fail with Contextual Distractors

Seongyun Lee, Yongrae Jo, Minju Seo, et al.

Beyond Static Tools: Test-Time Tool Evolution for Scientific Reasoning

Jiaxuan Lu, Ziyu Kong, Yemin Wang, et al.

VIBE: Visual Instruction Based Editor

Diffusion Model

Grigorii Alekseenko, Aleksandr Gordeev, Irina Tolstykh, et al.

Collaborative Multi-Agent Test-Time Reinforcement Learning for Reasoning

Reinforcement Learning

Zhiyuan Hu, Yunhai Hu, Juncheng Liu, et al.

Rewarding the Rare: Uniqueness-Aware RL for Creative Problem Solving in LLMs

Reinforcement Learning

Zhiyuan Hu, Yucheng Wang, Yufei He, et al.

Urban Socio-Semantic Segmentation with Vision-Language Reasoning

Image Segmentation

Semantic Segmentation

Yu Wang, Yi Wang, Rui Dai, et al.

STEP3-VL-10B Technical Report

Multimodal Representation

Visual Question Answering

Ailin Huang, Chengyuan Yao, Chunrui Han, et al.

SeedFold: Scaling Biomolecular Structure Prediction

Yi Zhou, Chan Lu, Yiming Ma, et al.

TranslateGemma Technical Report

Mara Finkelstein, Isaac Caswell, Tobias Domhan, et al.

Fast-ThinkAct: Efficient Vision-Language-Action Reasoning via Verbalizable Latent Planning

Embodied Intelligence

Chi-Pin Huang, Yunze Man, Zhiding Yu, et al.

SkinFlow: Efficient Information Transmission for Open Dermatological Diagnosis via Dynamic Visual Encoding and Staged RL

Image Generation

Lijun Liu, Linwei Chen, Zhishou Zhang, et al.

A^3-Bench: Benchmarking Memory-Driven Scientific Reasoning via Anchor and Attractor Activation

Jian Zhang, Yu He, Zhiyuan Wang, et al.

Controlled Self-Evolution for Algorithmic Code Optimization

Code Generation

Tu Hu, Ronghao Chen, Shuo Zhang, et al.

MAXS: Meta-Adaptive Exploration with LLM Agents

Jian Zhang, Zhiyuan Wang, Zhangqi Wang, et al.

DeepResearchEval: An Automated Framework for Deep Research Task Construction and Agentic Evaluation

Yibo Wang, Lei Wang, Yue Deng, et al.

The motivic class of the space of genus 0 maps to the flag variety

Jim Bryan, Balázs Elek, Freddie Manners, et al.

UniversalRAG: Retrieval-Augmented Generation over Corpora of Diverse Modalities and Granularities

Retrieval-Augmented Generation

Multimodal Representation

Woongyeong Yeo, Kangsan Kim, Soyeong Jeong, et al.

On the Non-decoupling of Supervised Fine-tuning and Reinforcement Learning in Post-training

Supervised Fine-Tuning

Reinforcement Learning

Xueyan Niu, Bo Bai, Wei Han, et al.

EpiCaR: Knowing What You Don't Know Matters for Better Reasoning in LLMs

Jewon Yeom, Jaewon Sok, Seonghyeon Park, et al.

Aligning Text, Code, and Vision: A Multi-Objective Reinforcement Learning Framework for Text-to-Visualization

Code Generation

Mizanur Rahman, Mohammed Saidul Islam, Md Tahmid Rahman Laskar, et al.

How Do Large Language Models Learn Concepts During Continual Pre-Training?

Barry Menglong Yao, Sha Li, Yunzhi Yao, et al.

JudgeRLVR: Judge First, Generate Second for Efficient Reasoning

Reinforcement Learning

Jiangshan Duo, Hanyu Li, Hailin Zhang, et al.

SnapGen++: Unleashing Diffusion Transformers for Efficient High-Fidelity Image Generation on Edge Devices

Diffusion Model

Image Generation

Dongting Hu, Aarush Gupta, Magzhan Gabidolla, et al.

Reasoning Models Generate Societies of Thought

Reasoning Models Generate Societies of Thought

Junsol Kim, Shiyang Lai, Nino Scherrer, et al.

A Large-Scale Study on the Development and Issues of Multi-Agent AI Systems

A Large-Scale Study on the Development and Issues of Multi-Agent AI Systems

Daniel Liu, Krishna Upadhyay, Vinaik Chhetri, et al.

ACoT-VLA: Action Chain-of-Thought for Vision-Language-Action Models

Embodied Intelligence

Linqing Zhong, Yi Liu, Yifei Wei, et al.

When Personalization Misleads: Understanding and Mitigating Hallucinations in Personalized LLMs

Intelligent Question Answering

Zhongxiang Sun, Yi Zhan, Chenglei Shen, et al.

RubricHub: A Comprehensive and Highly Discriminative Rubric Dataset via Automated Coarse-to-Fine Generation

Sunzhu Li, Jiale Zhao, Miteto Wei, et al.

Unlocking Implicit Experience: Synthesizing Tool-Use Trajectories from Text

Zhihao Xu, Rumei Li, Jiahuan Li, et al.

The Poisoned Apple Effect: Strategic Manipulation of Mediated Markets via Technology Expansion of AI Agents

Artificial Intelligence

Eilam Shapira, Roi Reichart, Moshe Tennenholtz

Your Group-Relative Advantage Is Biased

Reinforcement Learning

Fengkai Yang, Zherui Chen, Xiaohan Wang, et al.

STEM: Scaling Transformers with Embedding Modules

Ranajoy Sadhukhan, Sheng Cao, Harry Dong, et al.

Lost in the Noise: How Reasoning Models Fail with Contextual Distractors

Seongyun Lee, Yongrae Jo, Minju Seo, et al.

Beyond Static Tools: Test-Time Tool Evolution for Scientific Reasoning

Jiaxuan Lu, Ziyu Kong, Yemin Wang, et al.

VIBE: Visual Instruction Based Editor

Diffusion Model

Grigorii Alekseenko, Aleksandr Gordeev, Irina Tolstykh, et al.

Collaborative Multi-Agent Test-Time Reinforcement Learning for Reasoning

Reinforcement Learning

Zhiyuan Hu, Yunhai Hu, Juncheng Liu, et al.

Rewarding the Rare: Uniqueness-Aware RL for Creative Problem Solving in LLMs

Reinforcement Learning

Zhiyuan Hu, Yucheng Wang, Yufei He, et al.

Urban Socio-Semantic Segmentation with Vision-Language Reasoning

Image Segmentation

Semantic Segmentation

Yu Wang, Yi Wang, Rui Dai, et al.

STEP3-VL-10B Technical Report

Multimodal Representation

Visual Question Answering

Ailin Huang, Chengyuan Yao, Chunrui Han, et al.

SeedFold: Scaling Biomolecular Structure Prediction

Yi Zhou, Chan Lu, Yiming Ma, et al.

TranslateGemma Technical Report

Mara Finkelstein, Isaac Caswell, Tobias Domhan, et al.

Fast-ThinkAct: Efficient Vision-Language-Action Reasoning via Verbalizable Latent Planning

Embodied Intelligence

Chi-Pin Huang, Yunze Man, Zhiding Yu, et al.

SkinFlow: Efficient Information Transmission for Open Dermatological Diagnosis via Dynamic Visual Encoding and Staged RL

Image Generation

Lijun Liu, Linwei Chen, Zhishou Zhang, et al.

A^3-Bench: Benchmarking Memory-Driven Scientific Reasoning via Anchor and Attractor Activation

Jian Zhang, Yu He, Zhiyuan Wang, et al.

Controlled Self-Evolution for Algorithmic Code Optimization

Code Generation

Tu Hu, Ronghao Chen, Shuo Zhang, et al.

MAXS: Meta-Adaptive Exploration with LLM Agents

Jian Zhang, Zhiyuan Wang, Zhangqi Wang, et al.

DeepResearchEval: An Automated Framework for Deep Research Task Construction and Agentic Evaluation

Yibo Wang, Lei Wang, Yue Deng, et al.

The motivic class of the space of genus 0 maps to the flag variety

Jim Bryan, Balázs Elek, Freddie Manners, et al.

UniversalRAG: Retrieval-Augmented Generation over Corpora of Diverse Modalities and Granularities

Retrieval-Augmented Generation

Multimodal Representation

Woongyeong Yeo, Kangsan Kim, Soyeong Jeong, et al.

On the Non-decoupling of Supervised Fine-tuning and Reinforcement Learning in Post-training

Supervised Fine-Tuning

Reinforcement Learning

Xueyan Niu, Bo Bai, Wei Han, et al.

EpiCaR: Knowing What You Don't Know Matters for Better Reasoning in LLMs

Jewon Yeom, Jaewon Sok, Seonghyeon Park, et al.

Aligning Text, Code, and Vision: A Multi-Objective Reinforcement Learning Framework for Text-to-Visualization

Code Generation

Mizanur Rahman, Mohammed Saidul Islam, Md Tahmid Rahman Laskar, et al.

How Do Large Language Models Learn Concepts During Continual Pre-Training?

Barry Menglong Yao, Sha Li, Yunzhi Yao, et al.

JudgeRLVR: Judge First, Generate Second for Efficient Reasoning

Reinforcement Learning

Jiangshan Duo, Hanyu Li, Hailin Zhang, et al.

SnapGen++: Unleashing Diffusion Transformers for Efficient High-Fidelity Image Generation on Edge Devices

Diffusion Model

Image Generation

Dongting Hu, Aarush Gupta, Magzhan Gabidolla, et al.

ACoT-VLA: Action Chain-of-Thought for Vision-Language-Action Models

When Personalization Misleads: Understanding and Mitigating Hallucinations in Personalized LLMs

RubricHub: A Comprehensive and Highly Discriminative Rubric Dataset via Automated Coarse-to-Fine Generation

Unlocking Implicit Experience: Synthesizing Tool-Use Trajectories from Text

The Poisoned Apple Effect: Strategic Manipulation of Mediated Markets via Technology Expansion of AI Agents

Your Group-Relative Advantage Is Biased

STEM: Scaling Transformers with Embedding Modules

Lost in the Noise: How Reasoning Models Fail with Contextual Distractors

Beyond Static Tools: Test-Time Tool Evolution for Scientific Reasoning

VIBE: Visual Instruction Based Editor

Collaborative Multi-Agent Test-Time Reinforcement Learning for Reasoning

Rewarding the Rare: Uniqueness-Aware RL for Creative Problem Solving in LLMs

Urban Socio-Semantic Segmentation with Vision-Language Reasoning

STEP3-VL-10B Technical Report

SeedFold: Scaling Biomolecular Structure Prediction

TranslateGemma Technical Report

Fast-ThinkAct: Efficient Vision-Language-Action Reasoning via Verbalizable Latent Planning

SkinFlow: Efficient Information Transmission for Open Dermatological Diagnosis via Dynamic Visual Encoding and Staged RL

A^3-Bench: Benchmarking Memory-Driven Scientific Reasoning via Anchor and Attractor Activation

Controlled Self-Evolution for Algorithmic Code Optimization

MAXS: Meta-Adaptive Exploration with LLM Agents

DeepResearchEval: An Automated Framework for Deep Research Task Construction and Agentic Evaluation

The motivic class of the space of genus 0 maps to the flag variety

UniversalRAG: Retrieval-Augmented Generation over Corpora of Diverse Modalities and Granularities

On the Non-decoupling of Supervised Fine-tuning and Reinforcement Learning in Post-training

EpiCaR: Knowing What You Don't Know Matters for Better Reasoning in LLMs

Aligning Text, Code, and Vision: A Multi-Objective Reinforcement Learning Framework for Text-to-Visualization

How Do Large Language Models Learn Concepts During Continual Pre-Training?

JudgeRLVR: Judge First, Generate Second for Efficient Reasoning

SnapGen++: Unleashing Diffusion Transformers for Efficient High-Fidelity Image Generation on Edge Devices

ACoT-VLA: Action Chain-of-Thought for Vision-Language-Action Models

When Personalization Misleads: Understanding and Mitigating Hallucinations in Personalized LLMs

RubricHub: A Comprehensive and Highly Discriminative Rubric Dataset via Automated Coarse-to-Fine Generation

Unlocking Implicit Experience: Synthesizing Tool-Use Trajectories from Text

The Poisoned Apple Effect: Strategic Manipulation of Mediated Markets via Technology Expansion of AI Agents

Your Group-Relative Advantage Is Biased

STEM: Scaling Transformers with Embedding Modules

Lost in the Noise: How Reasoning Models Fail with Contextual Distractors

Beyond Static Tools: Test-Time Tool Evolution for Scientific Reasoning

VIBE: Visual Instruction Based Editor

Collaborative Multi-Agent Test-Time Reinforcement Learning for Reasoning

Rewarding the Rare: Uniqueness-Aware RL for Creative Problem Solving in LLMs

Urban Socio-Semantic Segmentation with Vision-Language Reasoning

STEP3-VL-10B Technical Report

SeedFold: Scaling Biomolecular Structure Prediction

TranslateGemma Technical Report

Fast-ThinkAct: Efficient Vision-Language-Action Reasoning via Verbalizable Latent Planning

SkinFlow: Efficient Information Transmission for Open Dermatological Diagnosis via Dynamic Visual Encoding and Staged RL

A^3-Bench: Benchmarking Memory-Driven Scientific Reasoning via Anchor and Attractor Activation

Controlled Self-Evolution for Algorithmic Code Optimization

MAXS: Meta-Adaptive Exploration with LLM Agents

DeepResearchEval: An Automated Framework for Deep Research Task Construction and Agentic Evaluation

The motivic class of the space of genus 0 maps to the flag variety

UniversalRAG: Retrieval-Augmented Generation over Corpora of Diverse Modalities and Granularities

On the Non-decoupling of Supervised Fine-tuning and Reinforcement Learning in Post-training

EpiCaR: Knowing What You Don't Know Matters for Better Reasoning in LLMs

Aligning Text, Code, and Vision: A Multi-Objective Reinforcement Learning Framework for Text-to-Visualization

How Do Large Language Models Learn Concepts During Continual Pre-Training?

JudgeRLVR: Judge First, Generate Second for Efficient Reasoning

SnapGen++: Unleashing Diffusion Transformers for Efficient High-Fidelity Image Generation on Edge Devices