HyperAI

Hauptbereich

GPU

Konsole
Studio
Dokumente
Preise

Pulse

Neuigkeiten

Ressourcen

Fachartikel
Notebooks
Datensätze
Wiki

Benchmarks

SOTA
LLM-Modelle
GPU-Bestenliste

Community

Veranstaltungen

Tools

Über uns Nutzungsbedingungen Datenschutzerklärung
Deutsch

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Täglich aktualisierte hochmoderne KI-Forschungsarbeiten, um Sie über die neuesten KI-Trends auf dem Laufenden zu halten

Gestalten Sie die Zukunft der Künstlichen Intelligenz

Über uns

Über uns Support Hilfe zu Datensätzen

Produkte

Neuigkeiten Fachartikel Notebooks Datensätze Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Hauptbereich

GPU

Konsole
Studio
Dokumente
Preise

Pulse

Neuigkeiten

Ressourcen

Fachartikel
Notebooks
Datensätze
Wiki

Benchmarks

SOTA
LLM-Modelle
GPU-Bestenliste

Community

Veranstaltungen

Tools

Über uns Nutzungsbedingungen Datenschutzerklärung
Deutsch

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Täglich aktualisierte hochmoderne KI-Forschungsarbeiten, um Sie über die neuesten KI-Trends auf dem Laufenden zu halten

Gestalten Sie die Zukunft der Künstlichen Intelligenz

Über uns

Über uns Support Hilfe zu Datensätzen

Produkte

Neuigkeiten Fachartikel Notebooks Datensätze Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

TransitLM: Ein großskaliger Datensatz und Benchmark für die Generierung von Transitrouten ohne Karte

TransitLM: Ein großskaliger Datensatz und Benchmark für die Generierung von Transitrouten ohne Karte

Hanyu Guo, Jiedong Yang, Chao Chen, et al.

DelTA: Diskriminative Token-Credit-Zuweisung für Verstärkungslernen aus überprüfbaren Belohnungen

DelTA: Diskriminative Token-Credit-Zuweisung für Verstärkungslernen aus überprüfbaren Belohnungen

Verstärkendes Lernen

Kaiyi Zhang, Wei Wu, Yankai Lin

Interaktive Bewertung erfordert eine Designwissenschaft

Keyang Xuan, Peiyang Song, Pan Lu, et al.

ESI-BENCH: Auf dem Weg zu einer verkörperten räumlichen Intelligenz, die die Wahrnehmungs-Aktions-Schließung ermöglicht

Körperliche Intelligenz

Yining Hong, Jiageng Liu, Han Yin, et al.

Vergleichende Analyse der militärischen Detektion unter Verwendung von Drohnenbildern über mehrere visuelle Spektrumbereiche

Objekterkennung

Maschinelles Sehen

Sourov Roy Shuvo, Prajwal Panth, Rajesh Chowdhury, et al.

Automatisierte ICD-Klassifizierung psychiatrischer Diagnosen: Von klassischem NLP zu großen Sprachmodellen

Natürliche Sprachverarbeitung

Fernando Ortega, Raúl Lara-Cabrera, Jorge Dueñas-Lerín, et al.

Koordiniertes optimales Power-Quality-Management in Verteilnetzen unter Nutzung der Restkapazität von Community-IBRs

Textgenerierung

Tiantian Ji, Pengfeng Lin, Miao Zhu, et al.

EllipseLIO: Adaptive LiDAR-Inertial-Odometrie mit einer Ellipsoid-Darstellung

3D-Maschinenvision

Rowan Border, Margarita Chli

SMoA: Spektralmodulationsadapter für parameter-effizientes Feintuning

Yongkang Liu, Xing Li, Mengjie Zhao, et al.

Erkennung von Trojaned DNNs durch spektrale Regressionsanalyse

Samuele Pasini, Jinhan Kim, Paolo Tonella

Die Illusion des Denkens: Das Verständnis der Stärken und Grenzen von Reasoning-Modellen aus der Perspektive der Problemkomplexität

Parshin Shojae, Iman Mirzadeh, Keivan Alizadeh, et al.

Generatives rekursives Reasoning

Textgenerierung

Junyeob Baek, Mingyu Jo, Minsu Kim, et al.

Safety Pretraining: Auf dem Weg zur nächsten Generation sicherer KI

Pratyush Maini, Sachin Goyal, Dylan Sam, et al.

RubricEM: Meta-RL mit rubrikgeleiteter Policy-Dekomposition jenseits überprüfbarer Belohnungen

Verstärkendes Lernen

Gaotang Li, Bhavana Dalvi Mishra, Zifeng Wang, et al.

Wenn die Vision für den Ton spricht

Xiaofei Wen, Wenjie Jacky Mo, Xingyu Fu, et al.

AutoResearchClaw: Selbstverstärkende autonome Forschung mit Mensch-KI-Zusammenarbeit

KI Für Die Wissenschaft

Jiaqi Liu, Shi Qiu, Mairui Li, et al.

Prozessbelohnungen mit erlernter Zuverlässigkeit

Verstärkendes Lernen

Jinyuan Li, Langlin Huang, Chengsong Huang, et al.

GoLongRL: Fähigkeitsorientiertes Langkontext-Verstärkungslernen mit Multitask-Ausrichtung

Verstärkendes Lernen

Minxuan Lv, Tiehua Mei, Tanlong Du, et al.

OpenComputer: Überprüfbare Softwarewelten für Computer-Nutzungs-Agents

Jinbiao Wei, Qianran Ma, Yilun Zhao, et al.

Anti-Selbstdistillation für reasoning RL über punktweise gegenseitige Information

Verstärkendes Lernen

Guobin Shen, Xiang Cheng, Chenxiao Zhao, et al.

Gezielte Neuronenmodulation durch Suche nach kontrastiven Paaren

Überwachtes Feinabstimmen

Sam Herring, Jake Naviasky, Karan Malhotra

Continuous Diffusion Skaliert Wettbewerbsfähig Mit Diskreter Diffusion Für Sprache

Diffusionsmodell

Textgenerierung

Zhihan Yang, Wei Guo, Shuibai Zhang, et al.

KVPO: ODE-natives GRPO für autoregressive Videoausrichtung durch KV-semantische Exploration

Ruicheng Zhang, Kaixi Cong, Jun Zhou, et al.

Code-as-Room: Generieren von 3D-Räumen aus Draufsichtbildern durch agentic Code-Synthese

Yixuan Yang, Zhen Luo, Wanshui Gan, et al.

KI für die automatische Forschung: Fahrplan und Benutzerhandbuch

KI Für Die Wissenschaft

Lingdong Kong, Xian Sun, Wei Chow, et al.

SkillsVote: Lebenszyklus-Steuerung von Agenten-Fähigkeiten von der Sammlung, Empfehlung bis zur Evolution

Hongyi Liu, Haoyan Yang, Tao Jiang, et al.

Lance: Einheitliches multimodales Modellieren durch Multi-Task-Synergie

Bildgenerierung

Fengyi Fu, Mengqi Huang, Shaojin Wu, et al.

LongLive-2.0: Eine NVFP4-Parallelinfrastruktur für die Generierung langer Videos

Diffusionsmodell

Yukang Chen, Luozhou Wang, Wei Huang, et al.

Aufschneiden und Würfel: Konfigurieren optimaler Gemische aus Experten

Margaret Li, Sneha Kudugunta, Danielle Rothermel, et al.

Agentengesteuerte Entdeckung neuronaler Architekturen: AIRA-Compose und AIRA-Design

Alberto Pepe, Chien-Yu Lin, Despoina Magka, et al.

Lernen, vorauszusehen: Enthüllung der Entschlüsselungseffizienz der On-Policy-Distillation

Überwachtes Feinabstimmen

Yuchen Cai, Ding Cao, Liang Lin, et al.

DexJoCo: Ein Benchmark und ein Toolkit für aufgabenorientierte geschickte Manipulation auf MuJoCo

Hanwen Wang, Weizhi Zhao, Xiangyu Wang, et al.

TransitLM: Ein großskaliger Datensatz und Benchmark für die Generierung von Transitrouten ohne Karte

TransitLM: Ein großskaliger Datensatz und Benchmark für die Generierung von Transitrouten ohne Karte

Hanyu Guo, Jiedong Yang, Chao Chen, et al.

DelTA: Diskriminative Token-Credit-Zuweisung für Verstärkungslernen aus überprüfbaren Belohnungen

DelTA: Diskriminative Token-Credit-Zuweisung für Verstärkungslernen aus überprüfbaren Belohnungen

Verstärkendes Lernen

Kaiyi Zhang, Wei Wu, Yankai Lin

Interaktive Bewertung erfordert eine Designwissenschaft

Keyang Xuan, Peiyang Song, Pan Lu, et al.

ESI-BENCH: Auf dem Weg zu einer verkörperten räumlichen Intelligenz, die die Wahrnehmungs-Aktions-Schließung ermöglicht

Körperliche Intelligenz

Yining Hong, Jiageng Liu, Han Yin, et al.

Vergleichende Analyse der militärischen Detektion unter Verwendung von Drohnenbildern über mehrere visuelle Spektrumbereiche

Objekterkennung

Maschinelles Sehen

Sourov Roy Shuvo, Prajwal Panth, Rajesh Chowdhury, et al.

Automatisierte ICD-Klassifizierung psychiatrischer Diagnosen: Von klassischem NLP zu großen Sprachmodellen

Natürliche Sprachverarbeitung

Fernando Ortega, Raúl Lara-Cabrera, Jorge Dueñas-Lerín, et al.

Koordiniertes optimales Power-Quality-Management in Verteilnetzen unter Nutzung der Restkapazität von Community-IBRs

Textgenerierung

Tiantian Ji, Pengfeng Lin, Miao Zhu, et al.

EllipseLIO: Adaptive LiDAR-Inertial-Odometrie mit einer Ellipsoid-Darstellung

3D-Maschinenvision

Rowan Border, Margarita Chli

SMoA: Spektralmodulationsadapter für parameter-effizientes Feintuning

Yongkang Liu, Xing Li, Mengjie Zhao, et al.

Erkennung von Trojaned DNNs durch spektrale Regressionsanalyse

Samuele Pasini, Jinhan Kim, Paolo Tonella

Die Illusion des Denkens: Das Verständnis der Stärken und Grenzen von Reasoning-Modellen aus der Perspektive der Problemkomplexität

Parshin Shojae, Iman Mirzadeh, Keivan Alizadeh, et al.

Generatives rekursives Reasoning

Textgenerierung

Junyeob Baek, Mingyu Jo, Minsu Kim, et al.

Safety Pretraining: Auf dem Weg zur nächsten Generation sicherer KI

Pratyush Maini, Sachin Goyal, Dylan Sam, et al.

RubricEM: Meta-RL mit rubrikgeleiteter Policy-Dekomposition jenseits überprüfbarer Belohnungen

Verstärkendes Lernen

Gaotang Li, Bhavana Dalvi Mishra, Zifeng Wang, et al.

Wenn die Vision für den Ton spricht

Xiaofei Wen, Wenjie Jacky Mo, Xingyu Fu, et al.

AutoResearchClaw: Selbstverstärkende autonome Forschung mit Mensch-KI-Zusammenarbeit

KI Für Die Wissenschaft

Jiaqi Liu, Shi Qiu, Mairui Li, et al.

Prozessbelohnungen mit erlernter Zuverlässigkeit

Verstärkendes Lernen

Jinyuan Li, Langlin Huang, Chengsong Huang, et al.

GoLongRL: Fähigkeitsorientiertes Langkontext-Verstärkungslernen mit Multitask-Ausrichtung

Verstärkendes Lernen

Minxuan Lv, Tiehua Mei, Tanlong Du, et al.

OpenComputer: Überprüfbare Softwarewelten für Computer-Nutzungs-Agents

Jinbiao Wei, Qianran Ma, Yilun Zhao, et al.

Anti-Selbstdistillation für reasoning RL über punktweise gegenseitige Information

Verstärkendes Lernen

Guobin Shen, Xiang Cheng, Chenxiao Zhao, et al.

Gezielte Neuronenmodulation durch Suche nach kontrastiven Paaren

Überwachtes Feinabstimmen

Sam Herring, Jake Naviasky, Karan Malhotra

Continuous Diffusion Skaliert Wettbewerbsfähig Mit Diskreter Diffusion Für Sprache

Diffusionsmodell

Textgenerierung

Zhihan Yang, Wei Guo, Shuibai Zhang, et al.

KVPO: ODE-natives GRPO für autoregressive Videoausrichtung durch KV-semantische Exploration

Ruicheng Zhang, Kaixi Cong, Jun Zhou, et al.

Code-as-Room: Generieren von 3D-Räumen aus Draufsichtbildern durch agentic Code-Synthese

Yixuan Yang, Zhen Luo, Wanshui Gan, et al.

KI für die automatische Forschung: Fahrplan und Benutzerhandbuch

KI Für Die Wissenschaft

Lingdong Kong, Xian Sun, Wei Chow, et al.

SkillsVote: Lebenszyklus-Steuerung von Agenten-Fähigkeiten von der Sammlung, Empfehlung bis zur Evolution

Hongyi Liu, Haoyan Yang, Tao Jiang, et al.

Lance: Einheitliches multimodales Modellieren durch Multi-Task-Synergie

Bildgenerierung

Fengyi Fu, Mengqi Huang, Shaojin Wu, et al.

LongLive-2.0: Eine NVFP4-Parallelinfrastruktur für die Generierung langer Videos

Diffusionsmodell

Yukang Chen, Luozhou Wang, Wei Huang, et al.

Aufschneiden und Würfel: Konfigurieren optimaler Gemische aus Experten

Margaret Li, Sneha Kudugunta, Danielle Rothermel, et al.

Agentengesteuerte Entdeckung neuronaler Architekturen: AIRA-Compose und AIRA-Design

Alberto Pepe, Chien-Yu Lin, Despoina Magka, et al.

Lernen, vorauszusehen: Enthüllung der Entschlüsselungseffizienz der On-Policy-Distillation

Überwachtes Feinabstimmen

Yuchen Cai, Ding Cao, Liang Lin, et al.

DexJoCo: Ein Benchmark und ein Toolkit für aufgabenorientierte geschickte Manipulation auf MuJoCo

Hanwen Wang, Weizhi Zhao, Xiangyu Wang, et al.

Interaktive Bewertung erfordert eine Designwissenschaft

ESI-BENCH: Auf dem Weg zu einer verkörperten räumlichen Intelligenz, die die Wahrnehmungs-Aktions-Schließung ermöglicht

Vergleichende Analyse der militärischen Detektion unter Verwendung von Drohnenbildern über mehrere visuelle Spektrumbereiche

Automatisierte ICD-Klassifizierung psychiatrischer Diagnosen: Von klassischem NLP zu großen Sprachmodellen

Koordiniertes optimales Power-Quality-Management in Verteilnetzen unter Nutzung der Restkapazität von Community-IBRs

EllipseLIO: Adaptive LiDAR-Inertial-Odometrie mit einer Ellipsoid-Darstellung

SMoA: Spektralmodulationsadapter für parameter-effizientes Feintuning

Erkennung von Trojaned DNNs durch spektrale Regressionsanalyse

Die Illusion des Denkens: Das Verständnis der Stärken und Grenzen von Reasoning-Modellen aus der Perspektive der Problemkomplexität

Generatives rekursives Reasoning

Safety Pretraining: Auf dem Weg zur nächsten Generation sicherer KI

RubricEM: Meta-RL mit rubrikgeleiteter Policy-Dekomposition jenseits überprüfbarer Belohnungen

Wenn die Vision für den Ton spricht

AutoResearchClaw: Selbstverstärkende autonome Forschung mit Mensch-KI-Zusammenarbeit

Prozessbelohnungen mit erlernter Zuverlässigkeit

GoLongRL: Fähigkeitsorientiertes Langkontext-Verstärkungslernen mit Multitask-Ausrichtung

OpenComputer: Überprüfbare Softwarewelten für Computer-Nutzungs-Agents

Anti-Selbstdistillation für reasoning RL über punktweise gegenseitige Information

Gezielte Neuronenmodulation durch Suche nach kontrastiven Paaren

Continuous Diffusion Skaliert Wettbewerbsfähig Mit Diskreter Diffusion Für Sprache

KVPO: ODE-natives GRPO für autoregressive Videoausrichtung durch KV-semantische Exploration

Code-as-Room: Generieren von 3D-Räumen aus Draufsichtbildern durch agentic Code-Synthese

KI für die automatische Forschung: Fahrplan und Benutzerhandbuch

SkillsVote: Lebenszyklus-Steuerung von Agenten-Fähigkeiten von der Sammlung, Empfehlung bis zur Evolution

Lance: Einheitliches multimodales Modellieren durch Multi-Task-Synergie

LongLive-2.0: Eine NVFP4-Parallelinfrastruktur für die Generierung langer Videos

Aufschneiden und Würfel: Konfigurieren optimaler Gemische aus Experten

Agentengesteuerte Entdeckung neuronaler Architekturen: AIRA-Compose und AIRA-Design

Lernen, vorauszusehen: Enthüllung der Entschlüsselungseffizienz der On-Policy-Distillation

DexJoCo: Ein Benchmark und ein Toolkit für aufgabenorientierte geschickte Manipulation auf MuJoCo

Interaktive Bewertung erfordert eine Designwissenschaft

ESI-BENCH: Auf dem Weg zu einer verkörperten räumlichen Intelligenz, die die Wahrnehmungs-Aktions-Schließung ermöglicht

Vergleichende Analyse der militärischen Detektion unter Verwendung von Drohnenbildern über mehrere visuelle Spektrumbereiche

Automatisierte ICD-Klassifizierung psychiatrischer Diagnosen: Von klassischem NLP zu großen Sprachmodellen

Koordiniertes optimales Power-Quality-Management in Verteilnetzen unter Nutzung der Restkapazität von Community-IBRs

EllipseLIO: Adaptive LiDAR-Inertial-Odometrie mit einer Ellipsoid-Darstellung

SMoA: Spektralmodulationsadapter für parameter-effizientes Feintuning

Erkennung von Trojaned DNNs durch spektrale Regressionsanalyse

Die Illusion des Denkens: Das Verständnis der Stärken und Grenzen von Reasoning-Modellen aus der Perspektive der Problemkomplexität

Generatives rekursives Reasoning

Safety Pretraining: Auf dem Weg zur nächsten Generation sicherer KI

RubricEM: Meta-RL mit rubrikgeleiteter Policy-Dekomposition jenseits überprüfbarer Belohnungen

Wenn die Vision für den Ton spricht

AutoResearchClaw: Selbstverstärkende autonome Forschung mit Mensch-KI-Zusammenarbeit

Prozessbelohnungen mit erlernter Zuverlässigkeit

GoLongRL: Fähigkeitsorientiertes Langkontext-Verstärkungslernen mit Multitask-Ausrichtung

OpenComputer: Überprüfbare Softwarewelten für Computer-Nutzungs-Agents

Anti-Selbstdistillation für reasoning RL über punktweise gegenseitige Information

Gezielte Neuronenmodulation durch Suche nach kontrastiven Paaren

Continuous Diffusion Skaliert Wettbewerbsfähig Mit Diskreter Diffusion Für Sprache

KVPO: ODE-natives GRPO für autoregressive Videoausrichtung durch KV-semantische Exploration

Code-as-Room: Generieren von 3D-Räumen aus Draufsichtbildern durch agentic Code-Synthese

KI für die automatische Forschung: Fahrplan und Benutzerhandbuch

SkillsVote: Lebenszyklus-Steuerung von Agenten-Fähigkeiten von der Sammlung, Empfehlung bis zur Evolution

Lance: Einheitliches multimodales Modellieren durch Multi-Task-Synergie

LongLive-2.0: Eine NVFP4-Parallelinfrastruktur für die Generierung langer Videos

Aufschneiden und Würfel: Konfigurieren optimaler Gemische aus Experten

Agentengesteuerte Entdeckung neuronaler Architekturen: AIRA-Compose und AIRA-Design

Lernen, vorauszusehen: Enthüllung der Entschlüsselungseffizienz der On-Policy-Distillation

DexJoCo: Ein Benchmark und ein Toolkit für aufgabenorientierte geschickte Manipulation auf MuJoCo