HyperAI

Hauptbereich

GPU

Konsole
Studio
Dokumente
Preise

Pulse

Neuigkeiten

Ressourcen

Fachartikel
Notebooks
Datensätze
Wiki

Benchmarks

SOTA
LLM-Modelle
GPU-Bestenliste

Community

Veranstaltungen

Tools

Über uns Nutzungsbedingungen Datenschutzerklärung
Deutsch

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Täglich aktualisierte hochmoderne KI-Forschungsarbeiten, um Sie über die neuesten KI-Trends auf dem Laufenden zu halten

Gestalten Sie die Zukunft der Künstlichen Intelligenz

Über uns

Über uns Support Hilfe zu Datensätzen

Produkte

Neuigkeiten Fachartikel Notebooks Datensätze Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Hauptbereich

GPU

Konsole
Studio
Dokumente
Preise

Pulse

Neuigkeiten

Ressourcen

Fachartikel
Notebooks
Datensätze
Wiki

Benchmarks

SOTA
LLM-Modelle
GPU-Bestenliste

Community

Veranstaltungen

Tools

Über uns Nutzungsbedingungen Datenschutzerklärung
Deutsch

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Täglich aktualisierte hochmoderne KI-Forschungsarbeiten, um Sie über die neuesten KI-Trends auf dem Laufenden zu halten

Gestalten Sie die Zukunft der Künstlichen Intelligenz

Über uns

Über uns Support Hilfe zu Datensätzen

Produkte

Neuigkeiten Fachartikel Notebooks Datensätze Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

MAKIEVAL: Ein mehrsprachiges automatisches Framework auf Grundlage von WiKIdata zur Evaluierung der kulturellen Sensibilität von LLMs

MAKIEVAL: Ein mehrsprachiges automatisches Framework auf Grundlage von WiKIdata zur Evaluierung der kulturellen Sensibilität von LLMs

Textgenerierung

Raoyuan Zhao, Beiduo Chen, Barbara Plank, et al.

GeneralVLA-2: Geometriebewusste Rekonstruktion und gesteuerter Speicher für die Roboterplanung

GeneralVLA-2: Geometriebewusste Rekonstruktion und gesteuerter Speicher für die Roboterplanung

3D-Maschinenvision

Retrieval-Augmented Generation

Haoyu Wang, Guoqing Ma, Zeyu Zhang, et al.

Mehrfach-Reflektives Masking ermöglicht das Schlussfolgern in Mask-Diffusionsmodellen

Diffusionsmodell

Textgenerierung

Yanming Zhang, Yihan Bian, Jingyuan Qi, et al.

BrainG3N: Ein Tokenizer mit zwei Verwendungszwecken zur kontrollierbaren 3D-Gehirn-MRT-Generierung

Diffusionsmodell

Max Van Puyvelde, Ibrahim Gulluk, Wim Van Criekinge, et al.

GateMem: Benchmarking der Speicherverwaltung in Multi-Principal Shared-Memory Agents

Zhe Ren, Yibo Yang, Yimeng Chen, et al.

MemSlides: Ein hierarchisches, gedächtnisgesteuertes Agent-Framework für die personalisierte Folien-Generierung mit mehrstufiger lokaler Überarbeitung

Ye Jin, Yangyang Xu, Jun Zhu, et al.

PerceptionDLM: Parallele Regionswahrnehmung mit multimodalen Diffusionssprachmodellen

Diffusionsmodell

Bildbeschreibung

Yueyi Sun, Yuhao Wang, Jason Li, et al.

Code-World-Modelle für das allgemeine Spielen von Spielen

Codegenerierung

Wolfgang Lehrach, Daniel Hennes, Miguel Lázaro-Gredilla, et al.

Jenseits statischer Leaderboards: Prädiktive Validität für die Evaluation von LLM Agents

Dhaval C. Patel, Kaoutar El Maghraoui, Shuxin Lin, et al.

S-Agent: Räumliche Werkzeugnutzung fördert das Schlussfolgern für räumliche Intelligenz

Yalun Dai, Hao Li, Shulin Tian, et al.

Multi-LCB: Erweiterung von LiveCodeBench auf mehrere Programmiersprachen

Codegenerierung

Maria Ivanova, Pavel Zadorozhny, Rodion Levichev, et al.

Verspieltes agentices Roboterlernen

Codegenerierung

Junyi Zhang, Jiaxin Ge, Hanjun Yoo, et al.

DragMesh-2: Physikalisch plausible geschickte Hand-Objekt-Interaktion mit gelenkigen Objekten

Tianshan Zhang, Yijia Duan, Yanjun Li, et al.

Moebius: 0.2B leichtgewichtiges Bildinpainting-Framework mit 10B-Niveau-Leistung

Diffusionsmodell

Kangsheng Duan, Ziyang Xu, Wenyu Liu, et al.

EfficientRollout: Systembewusstes selbstspekulatives Dekodieren für RL-Rollouts

Verstärkendes Lernen

Minseo Kim, Minjae Lee, Seunghyuk Oh, et al.

Vertraue dem richtigen Lehrer: Qualitätsbewusste Selbstdistillation für GUI-Verankerung

Jingyuan Huang, Zuming Huang, Yucheng Shi, et al.

Verstärkung der Zwei-Pfad-Schlussfolgerung in räumlichen Bild-Sprach-Modellen

3D-Maschinenvision

Yatai Ji, An-Chieh Cheng, Yang Fu, et al.

SAE-Interventionen sind unzuverlässig: Post-Interventions-Wiederherstellung unterdrückten Verhaltens

Mingyue Cui, Linghui Shen, Xingyi Yang

Kairos: Ein nativer Weltmodell-Stack für physische KI

Kairos Team, Fei Wang, Shan You, et al.

Guava: Ein effektiver und universeller Rahmen für verkörperte Manipulation

Körperliche Intelligenz

Haowen Liu, Xirui Li, Shaoxiong Yao, et al.

Jenseits der aktuellen Beobachtung: Evaluation multimodaler großer Sprachmodelle in kontrollierbaren nicht-markovschen Spielen

Shengyuan Ding, Xilin Wei, Xinyu Fang, et al.

LifeSciBench: Evaluierung von Language Models für realistische, experten-niveau Aufgabensets in den Life Sciences

Amelia Liu, Andrew Ho, Anne Marie Droste, et al.

TRIAGE: Dialektische Schlussfolgerung für erklärbare Risikovorhersage auf unregelmäßig abgetasteten medizinischen Zeitreihen mit LLMs

Hyeongwon Jang, Gyouk Chu, Changhun Kim, et al.

LectūraAgents: Ein Multi-Agent-Framework für adaptives personalisiertes KI-unterstütztes Lernen und verkörperten Unterricht

Körperliche Intelligenz

Jaward Sesay, Yue Yu, Siwei Dong, et al.

GameCraft-Bench: Können Agents spielbare Spiele End-to-End in einer realen Game-Engine erstellen?

Codegenerierung

Tongxu Luo, Rongsheng Wang, Jiaxi Bi, et al.

Zone der proximalen Politikoptimierung: Lehrer in Prompts, nicht in Gradienten

Verstärkendes Lernen

Byung-Kwan Lee, Ximing Lu, Shizhe Diao, et al.

ACE-Ego-0: Vereinheitlichung von egozentrischen menschlichen und robotischen Daten für VLA Pretraining

Überwachtes Feinabstimmen

Hao Li, Ganlong Zhao, Yufei Liu, et al.

LoopCoder-v2: Nur einmal durchlaufen für effiziente Skalierung der Testzeit-Berechnung

Codegenerierung

Jian Yang, Shawn Guo, Wei Zhang, et al.

Vorhersage der Sicherheit von LLMs vor der Veröffentlichung durch Simulation des Betriebs

Textgenerierung

Marcus Williams, Hannah Sheahan, Cameron Raymond, et al.

FastContext: Training eines effizienten Repository-Explorers für Coding Agents

Codegenerierung

Shaoqiu Zhang, Maoquan Wang, Yuling Shi, et al.

VibeThinker-3B: Erforschung der Grenzen überprüfbaren Schlussfolgens in kleinen Sprachmodellen

Überwachtes Feinabstimmen

Sen Xu, Shixi Liu, Wei Wang, et al.

DreamX-World 1.0: Ein universell einsetzbares interaktives Weltmodell

Diffusionsmodell

DreamX Team, Yancheng Bai, Rui Chen, et al.

MAKIEVAL: Ein mehrsprachiges automatisches Framework auf Grundlage von WiKIdata zur Evaluierung der kulturellen Sensibilität von LLMs

MAKIEVAL: Ein mehrsprachiges automatisches Framework auf Grundlage von WiKIdata zur Evaluierung der kulturellen Sensibilität von LLMs

Textgenerierung

Raoyuan Zhao, Beiduo Chen, Barbara Plank, et al.

GeneralVLA-2: Geometriebewusste Rekonstruktion und gesteuerter Speicher für die Roboterplanung

GeneralVLA-2: Geometriebewusste Rekonstruktion und gesteuerter Speicher für die Roboterplanung

3D-Maschinenvision

Retrieval-Augmented Generation

Haoyu Wang, Guoqing Ma, Zeyu Zhang, et al.

Mehrfach-Reflektives Masking ermöglicht das Schlussfolgern in Mask-Diffusionsmodellen

Diffusionsmodell

Textgenerierung

Yanming Zhang, Yihan Bian, Jingyuan Qi, et al.

BrainG3N: Ein Tokenizer mit zwei Verwendungszwecken zur kontrollierbaren 3D-Gehirn-MRT-Generierung

Diffusionsmodell

Max Van Puyvelde, Ibrahim Gulluk, Wim Van Criekinge, et al.

GateMem: Benchmarking der Speicherverwaltung in Multi-Principal Shared-Memory Agents

Zhe Ren, Yibo Yang, Yimeng Chen, et al.

MemSlides: Ein hierarchisches, gedächtnisgesteuertes Agent-Framework für die personalisierte Folien-Generierung mit mehrstufiger lokaler Überarbeitung

Ye Jin, Yangyang Xu, Jun Zhu, et al.

PerceptionDLM: Parallele Regionswahrnehmung mit multimodalen Diffusionssprachmodellen

Diffusionsmodell

Bildbeschreibung

Yueyi Sun, Yuhao Wang, Jason Li, et al.

Code-World-Modelle für das allgemeine Spielen von Spielen

Codegenerierung

Wolfgang Lehrach, Daniel Hennes, Miguel Lázaro-Gredilla, et al.

Jenseits statischer Leaderboards: Prädiktive Validität für die Evaluation von LLM Agents

Dhaval C. Patel, Kaoutar El Maghraoui, Shuxin Lin, et al.

S-Agent: Räumliche Werkzeugnutzung fördert das Schlussfolgern für räumliche Intelligenz

Yalun Dai, Hao Li, Shulin Tian, et al.

Multi-LCB: Erweiterung von LiveCodeBench auf mehrere Programmiersprachen

Codegenerierung

Maria Ivanova, Pavel Zadorozhny, Rodion Levichev, et al.

Verspieltes agentices Roboterlernen

Codegenerierung

Junyi Zhang, Jiaxin Ge, Hanjun Yoo, et al.

DragMesh-2: Physikalisch plausible geschickte Hand-Objekt-Interaktion mit gelenkigen Objekten

Tianshan Zhang, Yijia Duan, Yanjun Li, et al.

Moebius: 0.2B leichtgewichtiges Bildinpainting-Framework mit 10B-Niveau-Leistung

Diffusionsmodell

Kangsheng Duan, Ziyang Xu, Wenyu Liu, et al.

EfficientRollout: Systembewusstes selbstspekulatives Dekodieren für RL-Rollouts

Verstärkendes Lernen

Minseo Kim, Minjae Lee, Seunghyuk Oh, et al.

Vertraue dem richtigen Lehrer: Qualitätsbewusste Selbstdistillation für GUI-Verankerung

Jingyuan Huang, Zuming Huang, Yucheng Shi, et al.

Verstärkung der Zwei-Pfad-Schlussfolgerung in räumlichen Bild-Sprach-Modellen

3D-Maschinenvision

Yatai Ji, An-Chieh Cheng, Yang Fu, et al.

SAE-Interventionen sind unzuverlässig: Post-Interventions-Wiederherstellung unterdrückten Verhaltens

Mingyue Cui, Linghui Shen, Xingyi Yang

Kairos: Ein nativer Weltmodell-Stack für physische KI

Kairos Team, Fei Wang, Shan You, et al.

Guava: Ein effektiver und universeller Rahmen für verkörperte Manipulation

Körperliche Intelligenz

Haowen Liu, Xirui Li, Shaoxiong Yao, et al.

Jenseits der aktuellen Beobachtung: Evaluation multimodaler großer Sprachmodelle in kontrollierbaren nicht-markovschen Spielen

Shengyuan Ding, Xilin Wei, Xinyu Fang, et al.

LifeSciBench: Evaluierung von Language Models für realistische, experten-niveau Aufgabensets in den Life Sciences

Amelia Liu, Andrew Ho, Anne Marie Droste, et al.

TRIAGE: Dialektische Schlussfolgerung für erklärbare Risikovorhersage auf unregelmäßig abgetasteten medizinischen Zeitreihen mit LLMs

Hyeongwon Jang, Gyouk Chu, Changhun Kim, et al.

LectūraAgents: Ein Multi-Agent-Framework für adaptives personalisiertes KI-unterstütztes Lernen und verkörperten Unterricht

Körperliche Intelligenz

Jaward Sesay, Yue Yu, Siwei Dong, et al.

GameCraft-Bench: Können Agents spielbare Spiele End-to-End in einer realen Game-Engine erstellen?

Codegenerierung

Tongxu Luo, Rongsheng Wang, Jiaxi Bi, et al.

Zone der proximalen Politikoptimierung: Lehrer in Prompts, nicht in Gradienten

Verstärkendes Lernen

Byung-Kwan Lee, Ximing Lu, Shizhe Diao, et al.

ACE-Ego-0: Vereinheitlichung von egozentrischen menschlichen und robotischen Daten für VLA Pretraining

Überwachtes Feinabstimmen

Hao Li, Ganlong Zhao, Yufei Liu, et al.

LoopCoder-v2: Nur einmal durchlaufen für effiziente Skalierung der Testzeit-Berechnung

Codegenerierung

Jian Yang, Shawn Guo, Wei Zhang, et al.

Vorhersage der Sicherheit von LLMs vor der Veröffentlichung durch Simulation des Betriebs

Textgenerierung

Marcus Williams, Hannah Sheahan, Cameron Raymond, et al.

FastContext: Training eines effizienten Repository-Explorers für Coding Agents

Codegenerierung

Shaoqiu Zhang, Maoquan Wang, Yuling Shi, et al.

VibeThinker-3B: Erforschung der Grenzen überprüfbaren Schlussfolgens in kleinen Sprachmodellen

Überwachtes Feinabstimmen

Sen Xu, Shixi Liu, Wei Wang, et al.

DreamX-World 1.0: Ein universell einsetzbares interaktives Weltmodell

Diffusionsmodell

DreamX Team, Yancheng Bai, Rui Chen, et al.

Mehrfach-Reflektives Masking ermöglicht das Schlussfolgern in Mask-Diffusionsmodellen

BrainG3N: Ein Tokenizer mit zwei Verwendungszwecken zur kontrollierbaren 3D-Gehirn-MRT-Generierung

GateMem: Benchmarking der Speicherverwaltung in Multi-Principal Shared-Memory Agents

MemSlides: Ein hierarchisches, gedächtnisgesteuertes Agent-Framework für die personalisierte Folien-Generierung mit mehrstufiger lokaler Überarbeitung

PerceptionDLM: Parallele Regionswahrnehmung mit multimodalen Diffusionssprachmodellen

Code-World-Modelle für das allgemeine Spielen von Spielen

Jenseits statischer Leaderboards: Prädiktive Validität für die Evaluation von LLM Agents

S-Agent: Räumliche Werkzeugnutzung fördert das Schlussfolgern für räumliche Intelligenz

Multi-LCB: Erweiterung von LiveCodeBench auf mehrere Programmiersprachen

Verspieltes agentices Roboterlernen

DragMesh-2: Physikalisch plausible geschickte Hand-Objekt-Interaktion mit gelenkigen Objekten

Moebius: 0.2B leichtgewichtiges Bildinpainting-Framework mit 10B-Niveau-Leistung

EfficientRollout: Systembewusstes selbstspekulatives Dekodieren für RL-Rollouts

Vertraue dem richtigen Lehrer: Qualitätsbewusste Selbstdistillation für GUI-Verankerung

Verstärkung der Zwei-Pfad-Schlussfolgerung in räumlichen Bild-Sprach-Modellen

SAE-Interventionen sind unzuverlässig: Post-Interventions-Wiederherstellung unterdrückten Verhaltens

Kairos: Ein nativer Weltmodell-Stack für physische KI

Guava: Ein effektiver und universeller Rahmen für verkörperte Manipulation

Jenseits der aktuellen Beobachtung: Evaluation multimodaler großer Sprachmodelle in kontrollierbaren nicht-markovschen Spielen

LifeSciBench: Evaluierung von Language Models für realistische, experten-niveau Aufgabensets in den Life Sciences

TRIAGE: Dialektische Schlussfolgerung für erklärbare Risikovorhersage auf unregelmäßig abgetasteten medizinischen Zeitreihen mit LLMs

LectūraAgents: Ein Multi-Agent-Framework für adaptives personalisiertes KI-unterstütztes Lernen und verkörperten Unterricht

GameCraft-Bench: Können Agents spielbare Spiele End-to-End in einer realen Game-Engine erstellen?

Zone der proximalen Politikoptimierung: Lehrer in Prompts, nicht in Gradienten

ACE-Ego-0: Vereinheitlichung von egozentrischen menschlichen und robotischen Daten für VLA Pretraining

LoopCoder-v2: Nur einmal durchlaufen für effiziente Skalierung der Testzeit-Berechnung

Vorhersage der Sicherheit von LLMs vor der Veröffentlichung durch Simulation des Betriebs

FastContext: Training eines effizienten Repository-Explorers für Coding Agents

VibeThinker-3B: Erforschung der Grenzen überprüfbaren Schlussfolgens in kleinen Sprachmodellen

DreamX-World 1.0: Ein universell einsetzbares interaktives Weltmodell

Mehrfach-Reflektives Masking ermöglicht das Schlussfolgern in Mask-Diffusionsmodellen

BrainG3N: Ein Tokenizer mit zwei Verwendungszwecken zur kontrollierbaren 3D-Gehirn-MRT-Generierung

GateMem: Benchmarking der Speicherverwaltung in Multi-Principal Shared-Memory Agents

MemSlides: Ein hierarchisches, gedächtnisgesteuertes Agent-Framework für die personalisierte Folien-Generierung mit mehrstufiger lokaler Überarbeitung

PerceptionDLM: Parallele Regionswahrnehmung mit multimodalen Diffusionssprachmodellen

Code-World-Modelle für das allgemeine Spielen von Spielen

Jenseits statischer Leaderboards: Prädiktive Validität für die Evaluation von LLM Agents

S-Agent: Räumliche Werkzeugnutzung fördert das Schlussfolgern für räumliche Intelligenz

Multi-LCB: Erweiterung von LiveCodeBench auf mehrere Programmiersprachen

Verspieltes agentices Roboterlernen

DragMesh-2: Physikalisch plausible geschickte Hand-Objekt-Interaktion mit gelenkigen Objekten

Moebius: 0.2B leichtgewichtiges Bildinpainting-Framework mit 10B-Niveau-Leistung

EfficientRollout: Systembewusstes selbstspekulatives Dekodieren für RL-Rollouts

Vertraue dem richtigen Lehrer: Qualitätsbewusste Selbstdistillation für GUI-Verankerung

Verstärkung der Zwei-Pfad-Schlussfolgerung in räumlichen Bild-Sprach-Modellen

SAE-Interventionen sind unzuverlässig: Post-Interventions-Wiederherstellung unterdrückten Verhaltens

Kairos: Ein nativer Weltmodell-Stack für physische KI

Guava: Ein effektiver und universeller Rahmen für verkörperte Manipulation

Jenseits der aktuellen Beobachtung: Evaluation multimodaler großer Sprachmodelle in kontrollierbaren nicht-markovschen Spielen

LifeSciBench: Evaluierung von Language Models für realistische, experten-niveau Aufgabensets in den Life Sciences

TRIAGE: Dialektische Schlussfolgerung für erklärbare Risikovorhersage auf unregelmäßig abgetasteten medizinischen Zeitreihen mit LLMs

LectūraAgents: Ein Multi-Agent-Framework für adaptives personalisiertes KI-unterstütztes Lernen und verkörperten Unterricht

GameCraft-Bench: Können Agents spielbare Spiele End-to-End in einer realen Game-Engine erstellen?

Zone der proximalen Politikoptimierung: Lehrer in Prompts, nicht in Gradienten

ACE-Ego-0: Vereinheitlichung von egozentrischen menschlichen und robotischen Daten für VLA Pretraining

LoopCoder-v2: Nur einmal durchlaufen für effiziente Skalierung der Testzeit-Berechnung

Vorhersage der Sicherheit von LLMs vor der Veröffentlichung durch Simulation des Betriebs

FastContext: Training eines effizienten Repository-Explorers für Coding Agents

VibeThinker-3B: Erforschung der Grenzen überprüfbaren Schlussfolgens in kleinen Sprachmodellen

DreamX-World 1.0: Ein universell einsetzbares interaktives Weltmodell