HyperAI

Hauptbereich

GPU

Konsole
Studio
Dokumente
Preise

Pulse

Neuigkeiten

Ressourcen

Fachartikel
Notebooks
Datensätze
Wiki

Benchmarks

SOTA
LLM-Modelle
GPU-Bestenliste

Community

Veranstaltungen

Tools

Über uns Nutzungsbedingungen Datenschutzerklärung
Deutsch

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Täglich aktualisierte hochmoderne KI-Forschungsarbeiten, um Sie über die neuesten KI-Trends auf dem Laufenden zu halten

Gestalten Sie die Zukunft der Künstlichen Intelligenz

Über uns

Über uns Support Hilfe zu Datensätzen

Produkte

Neuigkeiten Fachartikel Notebooks Datensätze Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Hauptbereich

GPU

Konsole
Studio
Dokumente
Preise

Pulse

Neuigkeiten

Ressourcen

Fachartikel
Notebooks
Datensätze
Wiki

Benchmarks

SOTA
LLM-Modelle
GPU-Bestenliste

Community

Veranstaltungen

Tools

Über uns Nutzungsbedingungen Datenschutzerklärung
Deutsch

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Täglich aktualisierte hochmoderne KI-Forschungsarbeiten, um Sie über die neuesten KI-Trends auf dem Laufenden zu halten

Gestalten Sie die Zukunft der Künstlichen Intelligenz

Über uns

Über uns Support Hilfe zu Datensätzen

Produkte

Neuigkeiten Fachartikel Notebooks Datensätze Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

ReFreeKV: Auf dem Weg zur schwellwertfreien KV-Cache-Komprimierung

ReFreeKV: Auf dem Weg zur schwellwertfreien KV-Cache-Komprimierung

Xuanfan Ni, Liyan Xu, Chenyang Lyu, et al.

TUA-Bench: Ein Benchmark für universelle Terminal-Use-Agenten

TUA-Bench: Ein Benchmark für universelle Terminal-Use-Agenten

Shoufa Chen, Luyuan Wang, Xuan Yang, et al.

Den Horizont skalieren, nicht die Parameter: Billionen-Parameter-Leistung mit einem 35B-Agenten erreichen

Überwachtes Feinabstimmen

Agents-A1 Team, Zongsheng Cao, Bihao Zhan, et al.

LiveEdit: Auf dem Weg zur echtzeitfähigen, diffusionsbasierten Streaming-Videobearbeitung

Diffusionsmodell

Videobearbeitung

Xinyu Wang, Chongbo Zhao, Fangneng Zhan, et al.

Agentic Abstention: Wissen Agenten, wann sie aufhören sollten, statt zu handeln?

Han Luo, Bingbing Wen, Lucy Lu Wang

EVA-Bench: Ein neues End-to-End-Framework zur Bewertung von Sprachagenten

Tara Bogavelli, Gabrielle Gauthier Melançon, Katrina Stankiewicz, et al.

SingGuard: Ein richtlinienadaptiver multimodaler LLM-Guardrail mit dynamischem Reasoning

SingGuard Team, Yan Hong, Hongcheng Li, et al.

Formalisierung latenter Gedanken: Vier Axiome der Gedankenrepräsentation in LLMs

Fahd Seddik, Fatemeh Fard

MultiHashFormer: Hash-basierte generative Sprachmodelle

Textgenerierung

Huiyin Xue, Atsuki Yamaguchi, Nikolaos Aletras

Qwen-Image-2.0-RL Technischer Bericht

Diffusionsmodell

Yixian Xu, Kaiyuan Gao, Yuxiang Chen, et al.

Translation als Brückenhandlung: Übertragung von Manipulationsfähigkeiten vom Menschen auf Roboter

Sijin Chen, Kaixuan Jiang, Haixin Shi, et al.

PhysisForcing: Physikgestützter Weltsimulator für Roboter-Manipulation

Diffusionsmodell

Peiwen Zhang, Yufan Deng, Shangkun Sun, et al.

OpenTME: Ein offenes Datenset mit KI-basierten H&E-Tumor-Mikroumgebungsprofilen aus TCGA

Bildsegmentierung

Maaike Galama, Nina Kozar-Gillan, Christina Embacher, et al.

FlashAttention-4: Algorithmus- und Kernel-Pipelining-Co-Design für asymmetrisches Hardware-Scaling

Ted Zadouri, Markus Hoehnerbach, Jay Shah, et al.

DSpark: Semiautoregressive Generierung mit vertrauensbasierter spekulativer Decodierung

Textgenerierung

Xin Cheng, Xingkai Yu, Chenze Shao, et al.

ViQ: Textausgerichtete visuelle quantisierte Repräsentationen bei jeder Auflösung

Multimodale Darstellung

Xumin Yu, Zuyan Liu, Zhenyu Yang, et al.

Der Verifizierungshorizont: Keine Silberkugel für Coding Agent Belohnungen

Codegenerierung

Binghai Wang, Chenlong Zhang, Dayiheng Liu, et al.

Qwen-Image-Agent: Überbrücken der Kontextlücke in der realen Bildgenerierung

Bildgenerierung

Zekai Zhang, Jiahao Li, Jie Zhang, et al.

OPID: On-Policy-Fertigkeitsdistillation für Agenten-Verstärkungslernen

Verstärkendes Lernen

Shuo Yang, Jinyang Wu, Zhengxi Lu, et al.

Weltmodellierung im Kontext für die Robotersteuerung

Maschinelles Sehen

Siyin Wang, Junhao Shi, Senyu Fei, et al.

DanceOPD: On-Policy Generative Feld-Distillation

Bildgenerierung

Wei Zhou, Xiongwei Zhu, Zelin Xu, et al.

Autodata: Ein agenterbasierter Datenwissenschaftler zur Erstellung hochwertiger synthetischer Daten

Überwachtes Feinabstimmen

Ilia Kulikov, Chenxi Whitehouse, Tianhao Wu, et al.

Verbesserte Large Language Diffusion Models

Diffusionsmodell

Textgenerierung

Shen Nie, Qiyang Min, Shaoxuan Xu, et al.

Wie robust ist OCR-Reasoning? Bewertung der OCR-Reasoning-Robustheit von Vision-Language-Modellen unter visuellen Störungen

Dokumentenverstehen

Yuxing Cheng, Yuan Wu, Yi Chang

RoboAtlas: Kontextuelles aktives SLAM

3D-Maschinenvision

Alexander Schperberg, Shivam K. Panda, Abraham P. Vinod, et al.

Lernen der visuellen Roboternavigation in Menschenmengen mittels absichtsbewusster Szenenrepräsentationen

Aktionserkennung

Han Bao, Bingyi Xia, Hanjing Ye, et al.

Tiefes Verstärkungslernen-verbesserte ereignisgesteuerte datengetriebene prädiktive Regelung für einen 3D-kabelgetriebenen weichen Roboterarm

Verstärkendes Lernen

Cheng Ouyang, Moeen Ul Islam, Kaixiang Zhang, et al.

Natürliches Ungrokking: Asymmetrische Steuerung der Regeln, die das Pretraining überleben

Juliana Li, Diya Sreedhar

Jede nichtnegative ganze Zahl ist eine Summe aus einer Dreieckszahl, einer Fünfeckszahl und einer Siebeneckszahl.

Yichuan Cao, Dakai Guo, Ruichen Qiu, et al.

Loop-Engineering: Der Anthropic-Leitfaden zur Gestaltung von Systemen, die Ihre Agenten anweisen

Peter Steinberger, Boris Cherny, Addy Osmani

Kleine LLMs: Pruning im Vergleich zum Training von Grund auf

Yufeng Xu, Taiming Lu, Kunjun Li, et al.

OpenThoughts-Agent: Datenrezepte für agentische Modelle

Negin Raoof, Richard Zhuang, Marianna Nezhurina, et al.

ReFreeKV: Auf dem Weg zur schwellwertfreien KV-Cache-Komprimierung

ReFreeKV: Auf dem Weg zur schwellwertfreien KV-Cache-Komprimierung

Xuanfan Ni, Liyan Xu, Chenyang Lyu, et al.

TUA-Bench: Ein Benchmark für universelle Terminal-Use-Agenten

TUA-Bench: Ein Benchmark für universelle Terminal-Use-Agenten

Shoufa Chen, Luyuan Wang, Xuan Yang, et al.

Den Horizont skalieren, nicht die Parameter: Billionen-Parameter-Leistung mit einem 35B-Agenten erreichen

Überwachtes Feinabstimmen

Agents-A1 Team, Zongsheng Cao, Bihao Zhan, et al.

LiveEdit: Auf dem Weg zur echtzeitfähigen, diffusionsbasierten Streaming-Videobearbeitung

Diffusionsmodell

Videobearbeitung

Xinyu Wang, Chongbo Zhao, Fangneng Zhan, et al.

Agentic Abstention: Wissen Agenten, wann sie aufhören sollten, statt zu handeln?

Han Luo, Bingbing Wen, Lucy Lu Wang

EVA-Bench: Ein neues End-to-End-Framework zur Bewertung von Sprachagenten

Tara Bogavelli, Gabrielle Gauthier Melançon, Katrina Stankiewicz, et al.

SingGuard: Ein richtlinienadaptiver multimodaler LLM-Guardrail mit dynamischem Reasoning

SingGuard Team, Yan Hong, Hongcheng Li, et al.

Formalisierung latenter Gedanken: Vier Axiome der Gedankenrepräsentation in LLMs

Fahd Seddik, Fatemeh Fard

MultiHashFormer: Hash-basierte generative Sprachmodelle

Textgenerierung

Huiyin Xue, Atsuki Yamaguchi, Nikolaos Aletras

Qwen-Image-2.0-RL Technischer Bericht

Diffusionsmodell

Yixian Xu, Kaiyuan Gao, Yuxiang Chen, et al.

Translation als Brückenhandlung: Übertragung von Manipulationsfähigkeiten vom Menschen auf Roboter

Sijin Chen, Kaixuan Jiang, Haixin Shi, et al.

PhysisForcing: Physikgestützter Weltsimulator für Roboter-Manipulation

Diffusionsmodell

Peiwen Zhang, Yufan Deng, Shangkun Sun, et al.

OpenTME: Ein offenes Datenset mit KI-basierten H&E-Tumor-Mikroumgebungsprofilen aus TCGA

Bildsegmentierung

Maaike Galama, Nina Kozar-Gillan, Christina Embacher, et al.

FlashAttention-4: Algorithmus- und Kernel-Pipelining-Co-Design für asymmetrisches Hardware-Scaling

Ted Zadouri, Markus Hoehnerbach, Jay Shah, et al.

DSpark: Semiautoregressive Generierung mit vertrauensbasierter spekulativer Decodierung

Textgenerierung

Xin Cheng, Xingkai Yu, Chenze Shao, et al.

ViQ: Textausgerichtete visuelle quantisierte Repräsentationen bei jeder Auflösung

Multimodale Darstellung

Xumin Yu, Zuyan Liu, Zhenyu Yang, et al.

Der Verifizierungshorizont: Keine Silberkugel für Coding Agent Belohnungen

Codegenerierung

Binghai Wang, Chenlong Zhang, Dayiheng Liu, et al.

Qwen-Image-Agent: Überbrücken der Kontextlücke in der realen Bildgenerierung

Bildgenerierung

Zekai Zhang, Jiahao Li, Jie Zhang, et al.

OPID: On-Policy-Fertigkeitsdistillation für Agenten-Verstärkungslernen

Verstärkendes Lernen

Shuo Yang, Jinyang Wu, Zhengxi Lu, et al.

Weltmodellierung im Kontext für die Robotersteuerung

Maschinelles Sehen

Siyin Wang, Junhao Shi, Senyu Fei, et al.

DanceOPD: On-Policy Generative Feld-Distillation

Bildgenerierung

Wei Zhou, Xiongwei Zhu, Zelin Xu, et al.

Autodata: Ein agenterbasierter Datenwissenschaftler zur Erstellung hochwertiger synthetischer Daten

Überwachtes Feinabstimmen

Ilia Kulikov, Chenxi Whitehouse, Tianhao Wu, et al.

Verbesserte Large Language Diffusion Models

Diffusionsmodell

Textgenerierung

Shen Nie, Qiyang Min, Shaoxuan Xu, et al.

Wie robust ist OCR-Reasoning? Bewertung der OCR-Reasoning-Robustheit von Vision-Language-Modellen unter visuellen Störungen

Dokumentenverstehen

Yuxing Cheng, Yuan Wu, Yi Chang

RoboAtlas: Kontextuelles aktives SLAM

3D-Maschinenvision

Alexander Schperberg, Shivam K. Panda, Abraham P. Vinod, et al.

Lernen der visuellen Roboternavigation in Menschenmengen mittels absichtsbewusster Szenenrepräsentationen

Aktionserkennung

Han Bao, Bingyi Xia, Hanjing Ye, et al.

Tiefes Verstärkungslernen-verbesserte ereignisgesteuerte datengetriebene prädiktive Regelung für einen 3D-kabelgetriebenen weichen Roboterarm

Verstärkendes Lernen

Cheng Ouyang, Moeen Ul Islam, Kaixiang Zhang, et al.

Natürliches Ungrokking: Asymmetrische Steuerung der Regeln, die das Pretraining überleben

Juliana Li, Diya Sreedhar

Jede nichtnegative ganze Zahl ist eine Summe aus einer Dreieckszahl, einer Fünfeckszahl und einer Siebeneckszahl.

Yichuan Cao, Dakai Guo, Ruichen Qiu, et al.

Loop-Engineering: Der Anthropic-Leitfaden zur Gestaltung von Systemen, die Ihre Agenten anweisen

Peter Steinberger, Boris Cherny, Addy Osmani

Kleine LLMs: Pruning im Vergleich zum Training von Grund auf

Yufeng Xu, Taiming Lu, Kunjun Li, et al.

OpenThoughts-Agent: Datenrezepte für agentische Modelle

Negin Raoof, Richard Zhuang, Marianna Nezhurina, et al.

Den Horizont skalieren, nicht die Parameter: Billionen-Parameter-Leistung mit einem 35B-Agenten erreichen

LiveEdit: Auf dem Weg zur echtzeitfähigen, diffusionsbasierten Streaming-Videobearbeitung

Agentic Abstention: Wissen Agenten, wann sie aufhören sollten, statt zu handeln?

EVA-Bench: Ein neues End-to-End-Framework zur Bewertung von Sprachagenten

SingGuard: Ein richtlinienadaptiver multimodaler LLM-Guardrail mit dynamischem Reasoning

Formalisierung latenter Gedanken: Vier Axiome der Gedankenrepräsentation in LLMs

MultiHashFormer: Hash-basierte generative Sprachmodelle

Qwen-Image-2.0-RL Technischer Bericht

Translation als Brückenhandlung: Übertragung von Manipulationsfähigkeiten vom Menschen auf Roboter

PhysisForcing: Physikgestützter Weltsimulator für Roboter-Manipulation

OpenTME: Ein offenes Datenset mit KI-basierten H&E-Tumor-Mikroumgebungsprofilen aus TCGA

FlashAttention-4: Algorithmus- und Kernel-Pipelining-Co-Design für asymmetrisches Hardware-Scaling

DSpark: Semiautoregressive Generierung mit vertrauensbasierter spekulativer Decodierung

ViQ: Textausgerichtete visuelle quantisierte Repräsentationen bei jeder Auflösung

Der Verifizierungshorizont: Keine Silberkugel für Coding Agent Belohnungen

Qwen-Image-Agent: Überbrücken der Kontextlücke in der realen Bildgenerierung

OPID: On-Policy-Fertigkeitsdistillation für Agenten-Verstärkungslernen

Weltmodellierung im Kontext für die Robotersteuerung

DanceOPD: On-Policy Generative Feld-Distillation

Autodata: Ein agenterbasierter Datenwissenschaftler zur Erstellung hochwertiger synthetischer Daten

Verbesserte Large Language Diffusion Models

Wie robust ist OCR-Reasoning? Bewertung der OCR-Reasoning-Robustheit von Vision-Language-Modellen unter visuellen Störungen

RoboAtlas: Kontextuelles aktives SLAM

Lernen der visuellen Roboternavigation in Menschenmengen mittels absichtsbewusster Szenenrepräsentationen

Tiefes Verstärkungslernen-verbesserte ereignisgesteuerte datengetriebene prädiktive Regelung für einen 3D-kabelgetriebenen weichen Roboterarm

Natürliches Ungrokking: Asymmetrische Steuerung der Regeln, die das Pretraining überleben

Jede nichtnegative ganze Zahl ist eine Summe aus einer Dreieckszahl, einer Fünfeckszahl und einer Siebeneckszahl.

Loop-Engineering: Der Anthropic-Leitfaden zur Gestaltung von Systemen, die Ihre Agenten anweisen

Kleine LLMs: Pruning im Vergleich zum Training von Grund auf

OpenThoughts-Agent: Datenrezepte für agentische Modelle

Den Horizont skalieren, nicht die Parameter: Billionen-Parameter-Leistung mit einem 35B-Agenten erreichen

LiveEdit: Auf dem Weg zur echtzeitfähigen, diffusionsbasierten Streaming-Videobearbeitung

Agentic Abstention: Wissen Agenten, wann sie aufhören sollten, statt zu handeln?

EVA-Bench: Ein neues End-to-End-Framework zur Bewertung von Sprachagenten

SingGuard: Ein richtlinienadaptiver multimodaler LLM-Guardrail mit dynamischem Reasoning

Formalisierung latenter Gedanken: Vier Axiome der Gedankenrepräsentation in LLMs

MultiHashFormer: Hash-basierte generative Sprachmodelle

Qwen-Image-2.0-RL Technischer Bericht

Translation als Brückenhandlung: Übertragung von Manipulationsfähigkeiten vom Menschen auf Roboter

PhysisForcing: Physikgestützter Weltsimulator für Roboter-Manipulation

OpenTME: Ein offenes Datenset mit KI-basierten H&E-Tumor-Mikroumgebungsprofilen aus TCGA

FlashAttention-4: Algorithmus- und Kernel-Pipelining-Co-Design für asymmetrisches Hardware-Scaling

DSpark: Semiautoregressive Generierung mit vertrauensbasierter spekulativer Decodierung

ViQ: Textausgerichtete visuelle quantisierte Repräsentationen bei jeder Auflösung

Der Verifizierungshorizont: Keine Silberkugel für Coding Agent Belohnungen

Qwen-Image-Agent: Überbrücken der Kontextlücke in der realen Bildgenerierung

OPID: On-Policy-Fertigkeitsdistillation für Agenten-Verstärkungslernen

Weltmodellierung im Kontext für die Robotersteuerung

DanceOPD: On-Policy Generative Feld-Distillation

Autodata: Ein agenterbasierter Datenwissenschaftler zur Erstellung hochwertiger synthetischer Daten

Verbesserte Large Language Diffusion Models

Wie robust ist OCR-Reasoning? Bewertung der OCR-Reasoning-Robustheit von Vision-Language-Modellen unter visuellen Störungen

RoboAtlas: Kontextuelles aktives SLAM

Lernen der visuellen Roboternavigation in Menschenmengen mittels absichtsbewusster Szenenrepräsentationen

Tiefes Verstärkungslernen-verbesserte ereignisgesteuerte datengetriebene prädiktive Regelung für einen 3D-kabelgetriebenen weichen Roboterarm

Natürliches Ungrokking: Asymmetrische Steuerung der Regeln, die das Pretraining überleben

Jede nichtnegative ganze Zahl ist eine Summe aus einer Dreieckszahl, einer Fünfeckszahl und einer Siebeneckszahl.

Loop-Engineering: Der Anthropic-Leitfaden zur Gestaltung von Systemen, die Ihre Agenten anweisen

Kleine LLMs: Pruning im Vergleich zum Training von Grund auf

OpenThoughts-Agent: Datenrezepte für agentische Modelle