HyperAI

Main

GPU

Console
Studio
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Support Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Main

GPU

Console
Studio
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Support Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

Rethinking Cross-lingual Gaps from a Statistical Viewpoint

Rethinking Cross-lingual Gaps from a Statistical Viewpoint

Natural Language Processing

Vihari Piratla, Purvam Jain, Darshan Singh, et al.

Unleashing Scientific Reasoning for Bio-experimental Protocol Generation via Structured Component-based Reward Mechanism

Unleashing Scientific Reasoning for Bio-experimental Protocol Generation via Structured Component-based Reward Mechanism

Haoran Sun, Yankai Jiang, Zhenyu Tang, et al.

Skyfall-GS: Synthesizing Immersive 3D Urban Scenes from Satellite
Imagery

Diffusion Model

Jie-Ying Lee, Yi-Ruei Liu, Shr-Ruei Tsai, et al.

Emergent Misalignment via In-Context Learning: Narrow in-context examples can produce broadly misaligned LLMs

Nikita Afonin, Nikita Andriyanov, Nikhil Bageshpura, et al.

NANO3D: A Training-Free Approach for Efficient 3D Editing Without Masks

Image Inpainting

Junliang Ye, Shenghao Xie, Ruowen Zhao, et al.

Scaling Instruction-Based Video Editing with a High-Quality Synthetic
Dataset

Qingyan Bai, Qiuyu Wang, Hao Ouyang, et al.

OmniVinci: Enhancing Architecture and Data for Omni-Modal Understanding
LLM

Multimodal Representation

Hanrong Ye, Chao-Han Huck Yang, Arushi Goel, et al.

A Theoretical Study on Bridging Internal Probability and
Self-Consistency for LLM Reasoning

Zhi Zhou, Yuhao Tan, Zenan Li, et al.

DeepSeek-OCR: Contexts Optical Compression

Haoran Wei, Yaofeng Sun, Yukun Li

Direct Preference Optimization with Unobserved Preference Heterogeneity: The Necessity of Ternary Preferences

Preference Modeling

Keertana Chidambaram, Karthik Vinary Seetharaman, Vasilis Syrgkanis

Elucidated Rolling Diffusion Models for Probabilistic Weather Forecasting

Diffusion Model

Salva Rühling Cachay, Miika Aittala, Karsten Kreis, et al.

ImagerySearch: Adaptive Test-Time Search for Video Generation Beyond
Semantic Dependency Constraints

Meiqi Wu, Jiashu Zhu, Xiaokun Feng, et al.

From Pixels to Words -- Towards Native Vision-Language Primitives at
Scale

Multimodal Representation

Haiwen Diao, Mingxuan Li, Silei Wu, et al.

AI for Service: Proactive Assistance with AI Glasses

Zichen Wen, Yiyu Wang, Chenfei Liao, et al.

WithAnyone: Towards Controllable and ID Consistent Image Generation

Image Generation

Hengyuan Xu, Wei Cheng, Peng Xing, et al.

Agentic Entropy-Balanced Policy Optimization

Reinforcement Learning

Guanting Dong, Licheng Bao, Zhongyuan Wang, et al.

When Models Lie, We Learn: Multilingual Span-Level Hallucination Detection with PsiloQA

Elisei Rykov, Kseniia Petrushina, Maksim Savkin, et al.

Predicting sequence-specific amplification efficiency in multi-template PCR with deep learning

Convolutional Neural Network

Andreas L. Gimpel, Bowen Fan, Dexiong Chen, et al.

The Genome Analysis Toolkit: A MapReduce framework for analyzing next-generation DNA sequencing data

High-Performance Computing

Aaron McKenna, Matthew Hanna, Eric Banks, et al.

LAMMPS - a flexible simulation tool for particle-based materials modeling at the atomic, meso, and continuum scales

High-Performance Computing

Aidan P. Thompson, H. Metin Aktulga, Richard Berger, et al.

Dolphin: Document Image Parsing via Heterogeneous Anchor Prompting

Document Understanding

Hao Feng, Shu Wei, Xiang Fei, et al.

LiveCC: Learning Video LLM with Streaming Speech Transcription at Scale

Visual Question Answering

Joya Chen, Ziyun Zeng, Yiqi Lin, et al.

DeepMMSearch-R1: Empowering Multimodal LLMs in Multimodal Web Search

Visual Question Answering

Retrieval-Augmented Generation

Kartik Narayan, Yang Xu, Tian Cao, et al.

Scaling Large Language Models for Next-Generation Single-Cell Analysis

Syed Asad Rizvi, Daniel Levine, Aakash Patel, et al.

A Survey of Vibe Coding with Large Language Models

Yuyao Ge, Lingrui Mei, Zenghao Duan, et al.

Detect Anything via Next Point Prediction

Object Detection

Qing Jiang, Junan Huo, Xingyu Chen, et al.

Scaling Language-Centric Omnimodal Representation Learning

Multimodal Representation

Chenghao Xiao, Hou Pong Chan, Hao Zhang, et al.

DITING: A Multi-Agent Evaluation Framework for Benchmarking Web Novel
Translation

Enze Zhang, Jiaying Wang, Mengxi Xiao, et al.

Advancing End-to-End Pixel Space Generative Modeling via Self-supervised
Pre-training

Diffusion Model

Image Generation

Jiachen Lei, Keli Liu, Julius Berner, et al.

Spatial Forcing: Implicit Spatial Representation Alignment for
Vision-language-action Model

Multimodal Representation

Fuhao Li, Wenxuan Song, Han Zhao, et al.

Asking Clarifying Questions for Preference Elicitation With Large Language Models

Preference Modeling

Ali Montazeralghaem, Guy Tennenholtz, Craig Boutilier, et al.

CTRL-Rec: Controlling Recommender Systems With Natural Language

Preference Modeling

Natural Language Processing

Micah Carroll, Adeline Foote, Kevin Feng, et al.

Rethinking Cross-lingual Gaps from a Statistical Viewpoint

Rethinking Cross-lingual Gaps from a Statistical Viewpoint

Natural Language Processing

Vihari Piratla, Purvam Jain, Darshan Singh, et al.

Unleashing Scientific Reasoning for Bio-experimental Protocol Generation via Structured Component-based Reward Mechanism

Unleashing Scientific Reasoning for Bio-experimental Protocol Generation via Structured Component-based Reward Mechanism

Haoran Sun, Yankai Jiang, Zhenyu Tang, et al.

Skyfall-GS: Synthesizing Immersive 3D Urban Scenes from Satellite
Imagery

Diffusion Model

Jie-Ying Lee, Yi-Ruei Liu, Shr-Ruei Tsai, et al.

Emergent Misalignment via In-Context Learning: Narrow in-context examples can produce broadly misaligned LLMs

Nikita Afonin, Nikita Andriyanov, Nikhil Bageshpura, et al.

NANO3D: A Training-Free Approach for Efficient 3D Editing Without Masks

Image Inpainting

Junliang Ye, Shenghao Xie, Ruowen Zhao, et al.

Scaling Instruction-Based Video Editing with a High-Quality Synthetic
Dataset

Qingyan Bai, Qiuyu Wang, Hao Ouyang, et al.

OmniVinci: Enhancing Architecture and Data for Omni-Modal Understanding
LLM

Multimodal Representation

Hanrong Ye, Chao-Han Huck Yang, Arushi Goel, et al.

A Theoretical Study on Bridging Internal Probability and
Self-Consistency for LLM Reasoning

Zhi Zhou, Yuhao Tan, Zenan Li, et al.

DeepSeek-OCR: Contexts Optical Compression

Haoran Wei, Yaofeng Sun, Yukun Li

Direct Preference Optimization with Unobserved Preference Heterogeneity: The Necessity of Ternary Preferences

Preference Modeling

Keertana Chidambaram, Karthik Vinary Seetharaman, Vasilis Syrgkanis

Elucidated Rolling Diffusion Models for Probabilistic Weather Forecasting

Diffusion Model

Salva Rühling Cachay, Miika Aittala, Karsten Kreis, et al.

ImagerySearch: Adaptive Test-Time Search for Video Generation Beyond
Semantic Dependency Constraints

Meiqi Wu, Jiashu Zhu, Xiaokun Feng, et al.

From Pixels to Words -- Towards Native Vision-Language Primitives at
Scale

Multimodal Representation

Haiwen Diao, Mingxuan Li, Silei Wu, et al.

AI for Service: Proactive Assistance with AI Glasses

Zichen Wen, Yiyu Wang, Chenfei Liao, et al.

WithAnyone: Towards Controllable and ID Consistent Image Generation

Image Generation

Hengyuan Xu, Wei Cheng, Peng Xing, et al.

Agentic Entropy-Balanced Policy Optimization

Reinforcement Learning

Guanting Dong, Licheng Bao, Zhongyuan Wang, et al.

When Models Lie, We Learn: Multilingual Span-Level Hallucination Detection with PsiloQA

Elisei Rykov, Kseniia Petrushina, Maksim Savkin, et al.

Predicting sequence-specific amplification efficiency in multi-template PCR with deep learning

Convolutional Neural Network

Andreas L. Gimpel, Bowen Fan, Dexiong Chen, et al.

The Genome Analysis Toolkit: A MapReduce framework for analyzing next-generation DNA sequencing data

High-Performance Computing

Aaron McKenna, Matthew Hanna, Eric Banks, et al.

LAMMPS - a flexible simulation tool for particle-based materials modeling at the atomic, meso, and continuum scales

High-Performance Computing

Aidan P. Thompson, H. Metin Aktulga, Richard Berger, et al.

Dolphin: Document Image Parsing via Heterogeneous Anchor Prompting

Document Understanding

Hao Feng, Shu Wei, Xiang Fei, et al.

LiveCC: Learning Video LLM with Streaming Speech Transcription at Scale

Visual Question Answering

Joya Chen, Ziyun Zeng, Yiqi Lin, et al.

DeepMMSearch-R1: Empowering Multimodal LLMs in Multimodal Web Search

Visual Question Answering

Retrieval-Augmented Generation

Kartik Narayan, Yang Xu, Tian Cao, et al.

Scaling Large Language Models for Next-Generation Single-Cell Analysis

Syed Asad Rizvi, Daniel Levine, Aakash Patel, et al.

A Survey of Vibe Coding with Large Language Models

Yuyao Ge, Lingrui Mei, Zenghao Duan, et al.

Detect Anything via Next Point Prediction

Object Detection

Qing Jiang, Junan Huo, Xingyu Chen, et al.

Scaling Language-Centric Omnimodal Representation Learning

Multimodal Representation

Chenghao Xiao, Hou Pong Chan, Hao Zhang, et al.

DITING: A Multi-Agent Evaluation Framework for Benchmarking Web Novel
Translation

Enze Zhang, Jiaying Wang, Mengxi Xiao, et al.

Advancing End-to-End Pixel Space Generative Modeling via Self-supervised
Pre-training

Diffusion Model

Image Generation

Jiachen Lei, Keli Liu, Julius Berner, et al.

Spatial Forcing: Implicit Spatial Representation Alignment for
Vision-language-action Model

Multimodal Representation

Fuhao Li, Wenxuan Song, Han Zhao, et al.

Asking Clarifying Questions for Preference Elicitation With Large Language Models

Preference Modeling

Ali Montazeralghaem, Guy Tennenholtz, Craig Boutilier, et al.

CTRL-Rec: Controlling Recommender Systems With Natural Language

Preference Modeling

Natural Language Processing

Micah Carroll, Adeline Foote, Kevin Feng, et al.

Skyfall-GS: Synthesizing Immersive 3D Urban Scenes from Satellite Imagery

Emergent Misalignment via In-Context Learning: Narrow in-context examples can produce broadly misaligned LLMs

NANO3D: A Training-Free Approach for Efficient 3D Editing Without Masks

Scaling Instruction-Based Video Editing with a High-Quality Synthetic Dataset

OmniVinci: Enhancing Architecture and Data for Omni-Modal Understanding LLM

A Theoretical Study on Bridging Internal Probability and Self-Consistency for LLM Reasoning

DeepSeek-OCR: Contexts Optical Compression

Direct Preference Optimization with Unobserved Preference Heterogeneity: The Necessity of Ternary Preferences

Elucidated Rolling Diffusion Models for Probabilistic Weather Forecasting

ImagerySearch: Adaptive Test-Time Search for Video Generation Beyond Semantic Dependency Constraints

From Pixels to Words -- Towards Native Vision-Language Primitives at Scale

AI for Service: Proactive Assistance with AI Glasses

WithAnyone: Towards Controllable and ID Consistent Image Generation

Agentic Entropy-Balanced Policy Optimization

When Models Lie, We Learn: Multilingual Span-Level Hallucination Detection with PsiloQA

Predicting sequence-specific amplification efficiency in multi-template PCR with deep learning

The Genome Analysis Toolkit: A MapReduce framework for analyzing next-generation DNA sequencing data

LAMMPS - a flexible simulation tool for particle-based materials modeling at the atomic, meso, and continuum scales

Dolphin: Document Image Parsing via Heterogeneous Anchor Prompting

LiveCC: Learning Video LLM with Streaming Speech Transcription at Scale

DeepMMSearch-R1: Empowering Multimodal LLMs in Multimodal Web Search

Scaling Large Language Models for Next-Generation Single-Cell Analysis

A Survey of Vibe Coding with Large Language Models

Detect Anything via Next Point Prediction

Scaling Language-Centric Omnimodal Representation Learning

DITING: A Multi-Agent Evaluation Framework for Benchmarking Web Novel Translation

Advancing End-to-End Pixel Space Generative Modeling via Self-supervised Pre-training

Spatial Forcing: Implicit Spatial Representation Alignment for Vision-language-action Model

Asking Clarifying Questions for Preference Elicitation With Large Language Models

CTRL-Rec: Controlling Recommender Systems With Natural Language

Skyfall-GS: Synthesizing Immersive 3D Urban Scenes from Satellite Imagery

Emergent Misalignment via In-Context Learning: Narrow in-context examples can produce broadly misaligned LLMs

NANO3D: A Training-Free Approach for Efficient 3D Editing Without Masks

Scaling Instruction-Based Video Editing with a High-Quality Synthetic Dataset

OmniVinci: Enhancing Architecture and Data for Omni-Modal Understanding LLM

A Theoretical Study on Bridging Internal Probability and Self-Consistency for LLM Reasoning

DeepSeek-OCR: Contexts Optical Compression

Direct Preference Optimization with Unobserved Preference Heterogeneity: The Necessity of Ternary Preferences

Elucidated Rolling Diffusion Models for Probabilistic Weather Forecasting

ImagerySearch: Adaptive Test-Time Search for Video Generation Beyond Semantic Dependency Constraints

From Pixels to Words -- Towards Native Vision-Language Primitives at Scale

AI for Service: Proactive Assistance with AI Glasses

WithAnyone: Towards Controllable and ID Consistent Image Generation

Agentic Entropy-Balanced Policy Optimization

When Models Lie, We Learn: Multilingual Span-Level Hallucination Detection with PsiloQA

Predicting sequence-specific amplification efficiency in multi-template PCR with deep learning

The Genome Analysis Toolkit: A MapReduce framework for analyzing next-generation DNA sequencing data

LAMMPS - a flexible simulation tool for particle-based materials modeling at the atomic, meso, and continuum scales

Dolphin: Document Image Parsing via Heterogeneous Anchor Prompting

LiveCC: Learning Video LLM with Streaming Speech Transcription at Scale

DeepMMSearch-R1: Empowering Multimodal LLMs in Multimodal Web Search

Scaling Large Language Models for Next-Generation Single-Cell Analysis

A Survey of Vibe Coding with Large Language Models

Detect Anything via Next Point Prediction

Scaling Language-Centric Omnimodal Representation Learning

DITING: A Multi-Agent Evaluation Framework for Benchmarking Web Novel Translation

Advancing End-to-End Pixel Space Generative Modeling via Self-supervised Pre-training

Spatial Forcing: Implicit Spatial Representation Alignment for Vision-language-action Model

Asking Clarifying Questions for Preference Elicitation With Large Language Models

CTRL-Rec: Controlling Recommender Systems With Natural Language