HyperAI

Hauptbereich

GPU

Konsole
Studio
Dokumente
Preise

Pulse

Neuigkeiten

Ressourcen

Fachartikel
Notebooks
Datensätze
Wiki

Benchmarks

SOTA
LLM-Modelle
GPU-Bestenliste

Community

Veranstaltungen

Tools

Über uns Nutzungsbedingungen Datenschutzerklärung
Deutsch

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Täglich aktualisierte hochmoderne KI-Forschungsarbeiten, um Sie über die neuesten KI-Trends auf dem Laufenden zu halten

Gestalten Sie die Zukunft der Künstlichen Intelligenz

Über uns

Über uns Support Hilfe zu Datensätzen

Produkte

Neuigkeiten Fachartikel Notebooks Datensätze Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Hauptbereich

GPU

Konsole
Studio
Dokumente
Preise

Pulse

Neuigkeiten

Ressourcen

Fachartikel
Notebooks
Datensätze
Wiki

Benchmarks

SOTA
LLM-Modelle
GPU-Bestenliste

Community

Veranstaltungen

Tools

Über uns Nutzungsbedingungen Datenschutzerklärung
Deutsch

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Täglich aktualisierte hochmoderne KI-Forschungsarbeiten, um Sie über die neuesten KI-Trends auf dem Laufenden zu halten

Gestalten Sie die Zukunft der Künstlichen Intelligenz

Über uns

Über uns Support Hilfe zu Datensätzen

Produkte

Neuigkeiten Fachartikel Notebooks Datensätze Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

QuanBench+: Ein einheitliches Multi-Framework Benchmark für LLM-basiertes Quantum Code Generation

QuanBench+: Ein einheitliches Multi-Framework Benchmark für LLM-basiertes Quantum Code Generation

Codegenerierung

Ali Slim, Haydar Hamieh, Jawad Kotaich, et al.

ELT: Elastische geschaltete Transformer-Modelle für die visuelle Generierung

ELT: Elastische geschaltete Transformer-Modelle für die visuelle Generierung

Bildgenerierung

Sahil Goyal, Swayam Agrawal, Gautham Govind, et al.

ECHO: Effiziente Generierung von Thorax-Röntgenberichten mittels One-step Block Diffusion

Diffusionsmodell

Textgenerierung

Lifeng Chen, Tianqi You, Hao Liu, et al.

Matrix-Game 3.0: Ein Echtzeit- und Streaming-basiertes interaktives World Model mit Long-Horizon Memory

Zile Wang, Zexiang Liu, Jaixing Li, et al.

EXAONE 4.5 Technischer Bericht

Eunbi Choi, Kibong Choi, Sehyun Chun, et al.

RefineAnything: Multimodale regionsspezifische Verfeinerung für perfekte lokale Details

Diffusionsmodell

Dewei Zhou, You Li, Zongxin Yang, et al.

FORGE: Feinkörnige Multimodale Evaluation für Manufacturing-Szenarien

Maschinelles Sehen

Xiangru Jian, Hao Xu, Wei Pang, et al.

WildDet3D: Skalierung von Promptable 3D Detection in the Wild

3D-Maschinenvision

Objekterkennung

Weikai Huang, Jieyu Zhang, Sijun Li, et al.

Autoreason: Selbstverfeinerung, die weiß, wann sie aufhören muss

ActiveGlasses: Erlernen von Manipulation durch Active Vision aus egozentrischen menschlichen Demonstrationen

Yanwen Zou, Chenyang Shi, Wenyu Yu, et al.

MegaStyle: Konstruktion eines vielfältigen und skalierbaren Style-Datensatzes durch konsistentes Text-to-Image Style Mapping

Junyao Gao, Sibo Liu, Jiaxing Li, et al.

Wenn Zahlen sprechen: Die Ausrichtung von textuellen Zahlenwerten und visuellen Instanzen in Text-to-Video Diffusion Modellen

Diffusionsmodell

Zhengyang Sun, Yu Chen, Xin Zhou, et al.

HY-Embodied-0.5: Embodied Foundation Models für Real-World Agents

Körperliche Intelligenz

Tencent Robotics X, HY Vision Team, Xumin Yu, et al.

ClawBench: Können AI Agents alltägliche Online-Aufgaben bewältigen?

Yuxuan Zhang, Yubo Wang, Yipeng Zhu, et al.

Überdenken der Generalisierung beim Reasoning SFT: Eine bedingte Analyse von Optimierung, Daten und Model Capability

Überwachtes Feinabstimmen

Qihan Ren, Peng Wang, Ruikun Cai, et al.

SkillClaw: Lassen Sie Skills kollektiv mit dem Agentic Evolver evolvieren

Ziyu Ma, Shidong Yang, Yuxiang Ji, et al.

MDPBench: Ein Benchmark für mehrsprachiges Dokumenten-Parsing in realen Szenarien

Dokumentenverstehen

Zhang Li, Zhibo Lin, Qiang Liu, et al.

TC-AE: Freischaltung der Token-Kapazität für Deep Compression Autoencoders

Bildgenerierung

Teng Li, Ziyuan Huang, Cong Chen, et al.

INSPATIO-WORLD: Ein Echtzeit 4D-World-Simulator mittels spatiotemporaler autoregressiver Modellierung

InSpatio Team, Donghui Shen, Guofeng Zhang, et al.

FlowInOne: Unifying Multimodal Generation as Image-in, Image-out Flow Matching

Junchao Yi, Rui Zhao, Jiahao Tang, et al.

MARS: Ermöglicht die Multi-Token-Generierung für Autoregressive Modelle

Textgenerierung

Ziqi Jin, Lei Wang, Ziwei Luo, et al.

Denken in Strichen, nicht in Pixeln: Prozessgesteuerte Bildgenerierung durch interleaved Reasoning

Bildgenerierung

Lei Zhang, Junjiao Tian, Zhipeng Fan, et al.

RAGEN-2: Reasoning Collapse in Agentic RL

Zihan Wang, Chi Gui, Xing Jin, et al.

Vanast: Virtuelles Anprobieren durch Human Image Animation mittels synthetischer Triplet Supervision

Diffusionsmodell

Hyunsoo Cha, Wonjung Woo, Byungjun Kim, et al.

ThinkTwice: Gemeinsame Optimierung von Large Language Models für Reasoning und Self-Refinement

Difan Jiao, Qianfeng Wen, Blair Yang, et al.

ACES: Wer testet die Tests? Leave-One-Out AUC-Konsistenz für Code Generation

Codegenerierung

Hui Sun, Yun-Ji Zhang, Zheng Xie, et al.

Lernen des Retrieval aus Agent Trajectories

Retrieval-Augmented Generation

Yuqi Zhou, Sunhao Dai, Changle Qu, et al.

Claw-Eval: Auf dem Weg zu einer vertrauenswürdigen Evaluation von Autonomous Agents

Bowen Ye, Rang Li, Qibin Yang, et al.

Video-MME-v2: Auf dem Weg zur nächsten Stufe von Benchmarks für umfassendes Video Understanding

Visuelle Fragebeantwortung

Chaoyou Fu, Haozhi Yuan, Yuhao Dong, et al.

GrandCode: Erreichen des Grandmaster-Levels im Competitive Programming mittels Agentic Reinforcement Learning

Codegenerierung

DeepReinforce Team, Xiaoya Li, Xiaofei Sun, et al.

LIBERO-Para: Ein diagnostisches Benchmark und Metriken für die Robustheit gegenüber Paraphrasen in VLA-Modellen

Multimodale Darstellung

Chanyoung Kim, Minwoo Kim, Minseok Kang, et al.

TriAttention: Effiziente lange Reasoning-Prozesse mittels trigonometrischer KV-Compression

Weian Mao, Xi Lin, Wei Huang, et al.

QuanBench+: Ein einheitliches Multi-Framework Benchmark für LLM-basiertes Quantum Code Generation

QuanBench+: Ein einheitliches Multi-Framework Benchmark für LLM-basiertes Quantum Code Generation

Codegenerierung

Ali Slim, Haydar Hamieh, Jawad Kotaich, et al.

ELT: Elastische geschaltete Transformer-Modelle für die visuelle Generierung

ELT: Elastische geschaltete Transformer-Modelle für die visuelle Generierung

Bildgenerierung

Sahil Goyal, Swayam Agrawal, Gautham Govind, et al.

ECHO: Effiziente Generierung von Thorax-Röntgenberichten mittels One-step Block Diffusion

Diffusionsmodell

Textgenerierung

Lifeng Chen, Tianqi You, Hao Liu, et al.

Matrix-Game 3.0: Ein Echtzeit- und Streaming-basiertes interaktives World Model mit Long-Horizon Memory

Zile Wang, Zexiang Liu, Jaixing Li, et al.

EXAONE 4.5 Technischer Bericht

Eunbi Choi, Kibong Choi, Sehyun Chun, et al.

RefineAnything: Multimodale regionsspezifische Verfeinerung für perfekte lokale Details

Diffusionsmodell

Dewei Zhou, You Li, Zongxin Yang, et al.

FORGE: Feinkörnige Multimodale Evaluation für Manufacturing-Szenarien

Maschinelles Sehen

Xiangru Jian, Hao Xu, Wei Pang, et al.

WildDet3D: Skalierung von Promptable 3D Detection in the Wild

3D-Maschinenvision

Objekterkennung

Weikai Huang, Jieyu Zhang, Sijun Li, et al.

Autoreason: Selbstverfeinerung, die weiß, wann sie aufhören muss

ActiveGlasses: Erlernen von Manipulation durch Active Vision aus egozentrischen menschlichen Demonstrationen

Yanwen Zou, Chenyang Shi, Wenyu Yu, et al.

MegaStyle: Konstruktion eines vielfältigen und skalierbaren Style-Datensatzes durch konsistentes Text-to-Image Style Mapping

Junyao Gao, Sibo Liu, Jiaxing Li, et al.

Wenn Zahlen sprechen: Die Ausrichtung von textuellen Zahlenwerten und visuellen Instanzen in Text-to-Video Diffusion Modellen

Diffusionsmodell

Zhengyang Sun, Yu Chen, Xin Zhou, et al.

HY-Embodied-0.5: Embodied Foundation Models für Real-World Agents

Körperliche Intelligenz

Tencent Robotics X, HY Vision Team, Xumin Yu, et al.

ClawBench: Können AI Agents alltägliche Online-Aufgaben bewältigen?

Yuxuan Zhang, Yubo Wang, Yipeng Zhu, et al.

Überdenken der Generalisierung beim Reasoning SFT: Eine bedingte Analyse von Optimierung, Daten und Model Capability

Überwachtes Feinabstimmen

Qihan Ren, Peng Wang, Ruikun Cai, et al.

SkillClaw: Lassen Sie Skills kollektiv mit dem Agentic Evolver evolvieren

Ziyu Ma, Shidong Yang, Yuxiang Ji, et al.

MDPBench: Ein Benchmark für mehrsprachiges Dokumenten-Parsing in realen Szenarien

Dokumentenverstehen

Zhang Li, Zhibo Lin, Qiang Liu, et al.

TC-AE: Freischaltung der Token-Kapazität für Deep Compression Autoencoders

Bildgenerierung

Teng Li, Ziyuan Huang, Cong Chen, et al.

INSPATIO-WORLD: Ein Echtzeit 4D-World-Simulator mittels spatiotemporaler autoregressiver Modellierung

InSpatio Team, Donghui Shen, Guofeng Zhang, et al.

FlowInOne: Unifying Multimodal Generation as Image-in, Image-out Flow Matching

Junchao Yi, Rui Zhao, Jiahao Tang, et al.

MARS: Ermöglicht die Multi-Token-Generierung für Autoregressive Modelle

Textgenerierung

Ziqi Jin, Lei Wang, Ziwei Luo, et al.

Denken in Strichen, nicht in Pixeln: Prozessgesteuerte Bildgenerierung durch interleaved Reasoning

Bildgenerierung

Lei Zhang, Junjiao Tian, Zhipeng Fan, et al.

RAGEN-2: Reasoning Collapse in Agentic RL

Zihan Wang, Chi Gui, Xing Jin, et al.

Vanast: Virtuelles Anprobieren durch Human Image Animation mittels synthetischer Triplet Supervision

Diffusionsmodell

Hyunsoo Cha, Wonjung Woo, Byungjun Kim, et al.

ThinkTwice: Gemeinsame Optimierung von Large Language Models für Reasoning und Self-Refinement

Difan Jiao, Qianfeng Wen, Blair Yang, et al.

ACES: Wer testet die Tests? Leave-One-Out AUC-Konsistenz für Code Generation

Codegenerierung

Hui Sun, Yun-Ji Zhang, Zheng Xie, et al.

Lernen des Retrieval aus Agent Trajectories

Retrieval-Augmented Generation

Yuqi Zhou, Sunhao Dai, Changle Qu, et al.

Claw-Eval: Auf dem Weg zu einer vertrauenswürdigen Evaluation von Autonomous Agents

Bowen Ye, Rang Li, Qibin Yang, et al.

Video-MME-v2: Auf dem Weg zur nächsten Stufe von Benchmarks für umfassendes Video Understanding

Visuelle Fragebeantwortung

Chaoyou Fu, Haozhi Yuan, Yuhao Dong, et al.

GrandCode: Erreichen des Grandmaster-Levels im Competitive Programming mittels Agentic Reinforcement Learning

Codegenerierung

DeepReinforce Team, Xiaoya Li, Xiaofei Sun, et al.

LIBERO-Para: Ein diagnostisches Benchmark und Metriken für die Robustheit gegenüber Paraphrasen in VLA-Modellen

Multimodale Darstellung

Chanyoung Kim, Minwoo Kim, Minseok Kang, et al.

TriAttention: Effiziente lange Reasoning-Prozesse mittels trigonometrischer KV-Compression

Weian Mao, Xi Lin, Wei Huang, et al.

ECHO: Effiziente Generierung von Thorax-Röntgenberichten mittels One-step Block Diffusion

Matrix-Game 3.0: Ein Echtzeit- und Streaming-basiertes interaktives World Model mit Long-Horizon Memory

EXAONE 4.5 Technischer Bericht

RefineAnything: Multimodale regionsspezifische Verfeinerung für perfekte lokale Details

FORGE: Feinkörnige Multimodale Evaluation für Manufacturing-Szenarien

WildDet3D: Skalierung von Promptable 3D Detection in the Wild

Autoreason: Selbstverfeinerung, die weiß, wann sie aufhören muss

ActiveGlasses: Erlernen von Manipulation durch Active Vision aus egozentrischen menschlichen Demonstrationen

MegaStyle: Konstruktion eines vielfältigen und skalierbaren Style-Datensatzes durch konsistentes Text-to-Image Style Mapping

Wenn Zahlen sprechen: Die Ausrichtung von textuellen Zahlenwerten und visuellen Instanzen in Text-to-Video Diffusion Modellen

HY-Embodied-0.5: Embodied Foundation Models für Real-World Agents

ClawBench: Können AI Agents alltägliche Online-Aufgaben bewältigen?

Überdenken der Generalisierung beim Reasoning SFT: Eine bedingte Analyse von Optimierung, Daten und Model Capability

SkillClaw: Lassen Sie Skills kollektiv mit dem Agentic Evolver evolvieren

MDPBench: Ein Benchmark für mehrsprachiges Dokumenten-Parsing in realen Szenarien

TC-AE: Freischaltung der Token-Kapazität für Deep Compression Autoencoders

INSPATIO-WORLD: Ein Echtzeit 4D-World-Simulator mittels spatiotemporaler autoregressiver Modellierung

FlowInOne: Unifying Multimodal Generation as Image-in, Image-out Flow Matching

MARS: Ermöglicht die Multi-Token-Generierung für Autoregressive Modelle

Denken in Strichen, nicht in Pixeln: Prozessgesteuerte Bildgenerierung durch interleaved Reasoning

RAGEN-2: Reasoning Collapse in Agentic RL

Vanast: Virtuelles Anprobieren durch Human Image Animation mittels synthetischer Triplet Supervision

ThinkTwice: Gemeinsame Optimierung von Large Language Models für Reasoning und Self-Refinement

ACES: Wer testet die Tests? Leave-One-Out AUC-Konsistenz für Code Generation

Lernen des Retrieval aus Agent Trajectories

Claw-Eval: Auf dem Weg zu einer vertrauenswürdigen Evaluation von Autonomous Agents

Video-MME-v2: Auf dem Weg zur nächsten Stufe von Benchmarks für umfassendes Video Understanding

GrandCode: Erreichen des Grandmaster-Levels im Competitive Programming mittels Agentic Reinforcement Learning

LIBERO-Para: Ein diagnostisches Benchmark und Metriken für die Robustheit gegenüber Paraphrasen in VLA-Modellen

TriAttention: Effiziente lange Reasoning-Prozesse mittels trigonometrischer KV-Compression

ECHO: Effiziente Generierung von Thorax-Röntgenberichten mittels One-step Block Diffusion

Matrix-Game 3.0: Ein Echtzeit- und Streaming-basiertes interaktives World Model mit Long-Horizon Memory

EXAONE 4.5 Technischer Bericht

RefineAnything: Multimodale regionsspezifische Verfeinerung für perfekte lokale Details

FORGE: Feinkörnige Multimodale Evaluation für Manufacturing-Szenarien

WildDet3D: Skalierung von Promptable 3D Detection in the Wild

Autoreason: Selbstverfeinerung, die weiß, wann sie aufhören muss

ActiveGlasses: Erlernen von Manipulation durch Active Vision aus egozentrischen menschlichen Demonstrationen

MegaStyle: Konstruktion eines vielfältigen und skalierbaren Style-Datensatzes durch konsistentes Text-to-Image Style Mapping

Wenn Zahlen sprechen: Die Ausrichtung von textuellen Zahlenwerten und visuellen Instanzen in Text-to-Video Diffusion Modellen

HY-Embodied-0.5: Embodied Foundation Models für Real-World Agents

ClawBench: Können AI Agents alltägliche Online-Aufgaben bewältigen?

Überdenken der Generalisierung beim Reasoning SFT: Eine bedingte Analyse von Optimierung, Daten und Model Capability

SkillClaw: Lassen Sie Skills kollektiv mit dem Agentic Evolver evolvieren

MDPBench: Ein Benchmark für mehrsprachiges Dokumenten-Parsing in realen Szenarien

TC-AE: Freischaltung der Token-Kapazität für Deep Compression Autoencoders

INSPATIO-WORLD: Ein Echtzeit 4D-World-Simulator mittels spatiotemporaler autoregressiver Modellierung

FlowInOne: Unifying Multimodal Generation as Image-in, Image-out Flow Matching

MARS: Ermöglicht die Multi-Token-Generierung für Autoregressive Modelle

Denken in Strichen, nicht in Pixeln: Prozessgesteuerte Bildgenerierung durch interleaved Reasoning

RAGEN-2: Reasoning Collapse in Agentic RL

Vanast: Virtuelles Anprobieren durch Human Image Animation mittels synthetischer Triplet Supervision

ThinkTwice: Gemeinsame Optimierung von Large Language Models für Reasoning und Self-Refinement

ACES: Wer testet die Tests? Leave-One-Out AUC-Konsistenz für Code Generation

Lernen des Retrieval aus Agent Trajectories

Claw-Eval: Auf dem Weg zu einer vertrauenswürdigen Evaluation von Autonomous Agents

Video-MME-v2: Auf dem Weg zur nächsten Stufe von Benchmarks für umfassendes Video Understanding

GrandCode: Erreichen des Grandmaster-Levels im Competitive Programming mittels Agentic Reinforcement Learning

LIBERO-Para: Ein diagnostisches Benchmark und Metriken für die Robustheit gegenüber Paraphrasen in VLA-Modellen

TriAttention: Effiziente lange Reasoning-Prozesse mittels trigonometrischer KV-Compression