HyperAI

Hauptbereich

GPU

Konsole
Dokumente
Preise

Pulse

Neuigkeiten

Ressourcen

Fachartikel
Notebooks
Datensätze
Wiki

Benchmarks

SOTA
LLM-Modelle
GPU-Bestenliste

Community

Veranstaltungen

Tools

Über uns Nutzungsbedingungen Datenschutzerklärung
Deutsch

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Täglich aktualisierte hochmoderne KI-Forschungsarbeiten, um Sie über die neuesten KI-Trends auf dem Laufenden zu halten

Gestalten Sie die Zukunft der Künstlichen Intelligenz

Über uns

Über uns Hilfe zu Datensätzen

Produkte

Neuigkeiten Notebooks Datensätze Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Hauptbereich

GPU

Konsole
Dokumente
Preise

Pulse

Neuigkeiten

Ressourcen

Fachartikel
Notebooks
Datensätze
Wiki

Benchmarks

SOTA
LLM-Modelle
GPU-Bestenliste

Community

Veranstaltungen

Tools

Über uns Nutzungsbedingungen Datenschutzerklärung
Deutsch

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Täglich aktualisierte hochmoderne KI-Forschungsarbeiten, um Sie über die neuesten KI-Trends auf dem Laufenden zu halten

Gestalten Sie die Zukunft der Künstlichen Intelligenz

Über uns

Über uns Hilfe zu Datensätzen

Produkte

Neuigkeiten Notebooks Datensätze Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

Valet: Ein standardisiertes Testumgebungssystem für traditionelle Kartenspiele mit unvollständiger Information

Valet: Ein standardisiertes Testumgebungssystem für traditionelle Kartenspiele mit unvollständiger Information

KI-Infrastruktur

Mark Goadrich, Achille Morenville, Éric Piette

Spekulatives Dekodieren

Spekulatives Dekodieren

Textgenerierung

Tanishq Kumar, Tri Dao, Avner May

Nutzung von Lernfortschrittsverläufen zur Steuerung von KI-Feedback für das naturwissenschaftliche Lernen

Nutzung von Lernfortschrittsverläufen zur Steuerung von KI-Feedback für das naturwissenschaftliche Lernen

KI Für Die Wissenschaft

Xin Xia, Nejla Yuruk, Yun Wang, et al.

HoMMI: Erlernen ganzer Körper mobiler Manipulation aus menschlichen Demonstrationen

HoMMI: Erlernen ganzer Körper mobiler Manipulation aus menschlichen Demonstrationen

Körperliche Intelligenz

Xiaomeng Xu, Jisang Park, Han Zhang, et al.

Dichtengeleitete Antwortoptimierung: Gemeinschaftsgegroundete Ausrichtung über implizite Akzeptanzsignale

Dichtengeleitete Antwortoptimierung: Gemeinschaftsgegroundete Ausrichtung über implizite Akzeptanzsignale

Präferenzmodellierung

Patrick Gerard, Svitlana Volkova

Gravity Falls: Eine vergleichende Analyse von Methoden zur Erkennung von Domain-Generation-Algorithmen (DGA) bei Mobile-Device-Spearphishing

Gravity Falls: Eine vergleichende Analyse von Methoden zur Erkennung von Domain-Generation-Algorithmen (DGA) bei Mobile-Device-Spearphishing

Adam Dorian Wong, John D. Hastings

Von Entropie zur Epiplexität: Eine Neubewertung von Information für rechnerisch begrenzte Intelligenz

Von Entropie zur Epiplexität: Eine Neubewertung von Information für rechnerisch begrenzte Intelligenz

Marc Finzi, Shikai Qiu, Yiding Jiang, et al.

Der Gestaltungsraum dreimodaler maskierter Diffusionsmodelle

Der Gestaltungsraum dreimodaler maskierter Diffusionsmodelle

Diffusionsmodell

Louis Bethune, Victor Turrisi, Bruno Kacper Mlodozeniec, et al.

CHIMERA: Kompakte synthetische Daten für verallgemeinerungsfähiges LLM-Reasoning

CHIMERA: Kompakte synthetische Daten für verallgemeinerungsfähiges LLM-Reasoning

Xinyu Zhu, Yihao Feng, Yanchao Sun, et al.

RubricBench: Ausrichtung von von Modellen generierten Bewertungsraster mit menschlichen Standards

RubricBench: Ausrichtung von von Modellen generierten Bewertungsraster mit menschlichen Standards

Qiyuan Zhang, Junyi Zhou, Yufei Wang, et al.

MMR-Life: Zusammenfügen von Alltagszenen für multimodale Multi-Bild-Reasoning

MMR-Life: Zusammenfügen von Alltagszenen für multimodale Multi-Bild-Reasoning

Jiachun Li, Shaoping Huang, Zhuoran Jin, et al.

OpenAutoNLU: Open Source AutoML-Bibliothek für NLU

OpenAutoNLU: Open Source AutoML-Bibliothek für NLU

Natürliche Sprachverarbeitung

Grigory Arshinov, Aleksandr Boriskin, Sergey Senichev, et al.

OmniLottie: Generierung von Vektoranimationen über parametrisierte Lottie-Tokens

OmniLottie: Generierung von Vektoranimationen über parametrisierte Lottie-Tokens

Yiying Yang, Wei Cheng, Sijin Chen, et al.

Von der Skalierung zur Geschwindigkeit: Adaptive Test-Time-Skalierung für die Bildbearbeitung

Von der Skalierung zur Geschwindigkeit: Adaptive Test-Time-Skalierung für die Bildbearbeitung

Bildgenerierung

Xiangyan Qu, Zhenlong Yuan, Jing Tang, et al.

Zusammenarbeit mehrerer Agenten durch kontextuelle Inferenz von Mitspielern

Zusammenarbeit mehrerer Agenten durch kontextuelle Inferenz von Mitspielern

Verstärkendes Lernen

Marissa A. Weis, Maciej Wołczyk, Rajai Nasser, et al.

ActionEngine: Von reaktiven zu programmatischen GUI-Agenten durch Zustandsmaschinen-Speicher

ActionEngine: Von reaktiven zu programmatischen GUI-Agenten durch Zustandsmaschinen-Speicher

Codegenerierung

Hongbin Zhong, Fazle Faisal, Luis França, et al.

CiteAudit: Sie haben es zitiert, aber haben Sie es gelesen? Ein Benchmark zur Überprüfung wissenschaftlicher Referenzen im LLM-Zeitalter

CiteAudit: Sie haben es zitiert, aber haben Sie es gelesen? Ein Benchmark zur Überprüfung wissenschaftlicher Referenzen im LLM-Zeitalter

Retrieval-Augmented Generation

Zhengqing Yuan, Kaiwen Shi, Zheyuan Zhang, et al.

Modus-Suchend trifft auf Mittelwert-Suchend für schnelle Langvideoerzeugung

Modus-Suchend trifft auf Mittelwert-Suchend für schnelle Langvideoerzeugung

Diffusionsmodell

Shengqu Cai, Weili Nie, Chao Liu, et al.

CUDA Agent: Großskalige agentebasierte RL für leistungsstarke CUDA-Kernel-Generierung

CUDA Agent: Großskalige agentebasierte RL für leistungsstarke CUDA-Kernel-Generierung

Codegenerierung

Weinan Dai, Hanlin Wu, Qiying Yu, et al.

Recovered in Translation: Effiziente Pipeline für die automatisierte Übersetzung von Benchmarks und Datensätzen

Recovered in Translation: Effiziente Pipeline für die automatisierte Übersetzung von Benchmarks und Datensätzen

Hanna Yukhymenko, Anton Alexandrov, Martin Vechev

Verbesserung des räumlichen Verständnisses in der Bildgenerierung mittels Belohnungsmodellierung

Verbesserung des räumlichen Verständnisses in der Bildgenerierung mittels Belohnungsmodellierung

Bildgenerierung

Zhenyu Tang, Chaoran Feng, Yufan Deng, et al.

dLLM: Einfache Diffusions-Sprachmodellierung

dLLM: Einfache Diffusions-Sprachmodellierung

Diffusionsmodell

Textgenerierung

Zhanhui Zhou, Lingjie Chen, Hanghang Tong, et al.

Exploratorische, gedächtnisverstärkte LLM-Agenten durch hybride On- und Off-Policy-Optimierung

Exploratorische, gedächtnisverstärkte LLM-Agenten durch hybride On- und Off-Policy-Optimierung

Verstärkendes Lernen

Zeyuan Liu, Jeonghye Kim, Xufang Luo, et al.

Die Vorstellungskraft unterstützt die visuelle Schlussfolgerung, doch noch nicht im latente Raum

Die Vorstellungskraft unterstützt die visuelle Schlussfolgerung, doch noch nicht im latente Raum

Visuelle Fragebeantwortung

You Li, Chi Chen, Yanghao Li, et al.

OmniGAIA: Hin zu natively omni-modalen KI-Agenten

OmniGAIA: Hin zu natively omni-modalen KI-Agenten

Xiaoxi Li, Wenxiang Jiao, Jiarui Jin, et al.

MobilityBench: Ein Benchmark zur Bewertung von Route-Planning-Agenten in realen Mobilitätsszenarien

MobilityBench: Ein Benchmark zur Bewertung von Route-Planning-Agenten in realen Mobilitätsszenarien

Intelligente Fragebeantwortung

Zhiheng Song, Jingshuai Zhang, Chuan Qin, et al.

Von Blindstellen zu Gewinnen: diagnostikgetriebenes iteratives Training für große multimodale Modelle

Von Blindstellen zu Gewinnen: diagnostikgetriebenes iteratives Training für große multimodale Modelle

Hongrui Jia, Chaoya Jiang, Shikun Zhang, et al.

Die Dreifaltigkeit der Konsistenz als definierendes Prinzip für allgemeine Weltmodelle

Die Dreifaltigkeit der Konsistenz als definierendes Prinzip für allgemeine Weltmodelle

Multimodale Darstellung

Jingxuan Wei, Siyuan Li, Yuhang Xu, et al.

GUI-Libra: Training Native GUI Agents to Reason and Act with Action-aware Supervision and Partially Verifiable RL

GUI-Libra: Training Native GUI Agents to Reason and Act with Action-aware Supervision and Partially Verifiable RL

Überwachtes Feinabstimmen

Rui Yang, Qianhui Wu, Zhaoyang Wang, et al.

SkyReels-V4: Mehrmodales Video-Audio-Generierungs-, Inpainting- und Bearbeitungsmodell

SkyReels-V4: Mehrmodales Video-Audio-Generierungs-, Inpainting- und Bearbeitungsmodell

Diffusionsmodell

Guibin Chen, Dixuan Lin, Jiangping Yang, et al.

ARLArena: Ein einheitlicher Rahmen für stabiles agenzienbasiertes Verstärkungslernen

ARLArena: Ein einheitlicher Rahmen für stabiles agenzienbasiertes Verstärkungslernen

Verstärkendes Lernen

Xiaoxuan Wang, Han Zhang, Haixin Wang, et al.

DreamID-Omni: Einheitlicher Rahmen für steuerbare, menschenzentrierte Audio-Video-Generierung

DreamID-Omni: Einheitlicher Rahmen für steuerbare, menschenzentrierte Audio-Video-Generierung

Xu Guo, Fulong Ye, Qichao Sun, et al.

Valet: Ein standardisiertes Testumgebungssystem für traditionelle Kartenspiele mit unvollständiger Information

Valet: Ein standardisiertes Testumgebungssystem für traditionelle Kartenspiele mit unvollständiger Information

KI-Infrastruktur

Mark Goadrich, Achille Morenville, Éric Piette

Spekulatives Dekodieren

Spekulatives Dekodieren

Textgenerierung

Tanishq Kumar, Tri Dao, Avner May

Nutzung von Lernfortschrittsverläufen zur Steuerung von KI-Feedback für das naturwissenschaftliche Lernen

Nutzung von Lernfortschrittsverläufen zur Steuerung von KI-Feedback für das naturwissenschaftliche Lernen

KI Für Die Wissenschaft

Xin Xia, Nejla Yuruk, Yun Wang, et al.

HoMMI: Erlernen ganzer Körper mobiler Manipulation aus menschlichen Demonstrationen

HoMMI: Erlernen ganzer Körper mobiler Manipulation aus menschlichen Demonstrationen

Körperliche Intelligenz

Xiaomeng Xu, Jisang Park, Han Zhang, et al.

Dichtengeleitete Antwortoptimierung: Gemeinschaftsgegroundete Ausrichtung über implizite Akzeptanzsignale

Dichtengeleitete Antwortoptimierung: Gemeinschaftsgegroundete Ausrichtung über implizite Akzeptanzsignale

Präferenzmodellierung

Patrick Gerard, Svitlana Volkova

Gravity Falls: Eine vergleichende Analyse von Methoden zur Erkennung von Domain-Generation-Algorithmen (DGA) bei Mobile-Device-Spearphishing

Gravity Falls: Eine vergleichende Analyse von Methoden zur Erkennung von Domain-Generation-Algorithmen (DGA) bei Mobile-Device-Spearphishing

Adam Dorian Wong, John D. Hastings

Von Entropie zur Epiplexität: Eine Neubewertung von Information für rechnerisch begrenzte Intelligenz

Von Entropie zur Epiplexität: Eine Neubewertung von Information für rechnerisch begrenzte Intelligenz

Marc Finzi, Shikai Qiu, Yiding Jiang, et al.

Der Gestaltungsraum dreimodaler maskierter Diffusionsmodelle

Der Gestaltungsraum dreimodaler maskierter Diffusionsmodelle

Diffusionsmodell

Louis Bethune, Victor Turrisi, Bruno Kacper Mlodozeniec, et al.

CHIMERA: Kompakte synthetische Daten für verallgemeinerungsfähiges LLM-Reasoning

CHIMERA: Kompakte synthetische Daten für verallgemeinerungsfähiges LLM-Reasoning

Xinyu Zhu, Yihao Feng, Yanchao Sun, et al.

RubricBench: Ausrichtung von von Modellen generierten Bewertungsraster mit menschlichen Standards

RubricBench: Ausrichtung von von Modellen generierten Bewertungsraster mit menschlichen Standards

Qiyuan Zhang, Junyi Zhou, Yufei Wang, et al.

MMR-Life: Zusammenfügen von Alltagszenen für multimodale Multi-Bild-Reasoning

MMR-Life: Zusammenfügen von Alltagszenen für multimodale Multi-Bild-Reasoning

Jiachun Li, Shaoping Huang, Zhuoran Jin, et al.

OpenAutoNLU: Open Source AutoML-Bibliothek für NLU

OpenAutoNLU: Open Source AutoML-Bibliothek für NLU

Natürliche Sprachverarbeitung

Grigory Arshinov, Aleksandr Boriskin, Sergey Senichev, et al.

OmniLottie: Generierung von Vektoranimationen über parametrisierte Lottie-Tokens

OmniLottie: Generierung von Vektoranimationen über parametrisierte Lottie-Tokens

Yiying Yang, Wei Cheng, Sijin Chen, et al.

Von der Skalierung zur Geschwindigkeit: Adaptive Test-Time-Skalierung für die Bildbearbeitung

Von der Skalierung zur Geschwindigkeit: Adaptive Test-Time-Skalierung für die Bildbearbeitung

Bildgenerierung

Xiangyan Qu, Zhenlong Yuan, Jing Tang, et al.

Zusammenarbeit mehrerer Agenten durch kontextuelle Inferenz von Mitspielern

Zusammenarbeit mehrerer Agenten durch kontextuelle Inferenz von Mitspielern

Verstärkendes Lernen

Marissa A. Weis, Maciej Wołczyk, Rajai Nasser, et al.

ActionEngine: Von reaktiven zu programmatischen GUI-Agenten durch Zustandsmaschinen-Speicher

ActionEngine: Von reaktiven zu programmatischen GUI-Agenten durch Zustandsmaschinen-Speicher

Codegenerierung

Hongbin Zhong, Fazle Faisal, Luis França, et al.

CiteAudit: Sie haben es zitiert, aber haben Sie es gelesen? Ein Benchmark zur Überprüfung wissenschaftlicher Referenzen im LLM-Zeitalter

CiteAudit: Sie haben es zitiert, aber haben Sie es gelesen? Ein Benchmark zur Überprüfung wissenschaftlicher Referenzen im LLM-Zeitalter

Retrieval-Augmented Generation

Zhengqing Yuan, Kaiwen Shi, Zheyuan Zhang, et al.

Modus-Suchend trifft auf Mittelwert-Suchend für schnelle Langvideoerzeugung

Modus-Suchend trifft auf Mittelwert-Suchend für schnelle Langvideoerzeugung

Diffusionsmodell

Shengqu Cai, Weili Nie, Chao Liu, et al.

CUDA Agent: Großskalige agentebasierte RL für leistungsstarke CUDA-Kernel-Generierung

CUDA Agent: Großskalige agentebasierte RL für leistungsstarke CUDA-Kernel-Generierung

Codegenerierung

Weinan Dai, Hanlin Wu, Qiying Yu, et al.

Recovered in Translation: Effiziente Pipeline für die automatisierte Übersetzung von Benchmarks und Datensätzen

Recovered in Translation: Effiziente Pipeline für die automatisierte Übersetzung von Benchmarks und Datensätzen

Hanna Yukhymenko, Anton Alexandrov, Martin Vechev

Verbesserung des räumlichen Verständnisses in der Bildgenerierung mittels Belohnungsmodellierung

Verbesserung des räumlichen Verständnisses in der Bildgenerierung mittels Belohnungsmodellierung

Bildgenerierung

Zhenyu Tang, Chaoran Feng, Yufan Deng, et al.

dLLM: Einfache Diffusions-Sprachmodellierung

dLLM: Einfache Diffusions-Sprachmodellierung

Diffusionsmodell

Textgenerierung

Zhanhui Zhou, Lingjie Chen, Hanghang Tong, et al.

Exploratorische, gedächtnisverstärkte LLM-Agenten durch hybride On- und Off-Policy-Optimierung

Exploratorische, gedächtnisverstärkte LLM-Agenten durch hybride On- und Off-Policy-Optimierung

Verstärkendes Lernen

Zeyuan Liu, Jeonghye Kim, Xufang Luo, et al.

Die Vorstellungskraft unterstützt die visuelle Schlussfolgerung, doch noch nicht im latente Raum

Die Vorstellungskraft unterstützt die visuelle Schlussfolgerung, doch noch nicht im latente Raum

Visuelle Fragebeantwortung

You Li, Chi Chen, Yanghao Li, et al.

OmniGAIA: Hin zu natively omni-modalen KI-Agenten

OmniGAIA: Hin zu natively omni-modalen KI-Agenten

Xiaoxi Li, Wenxiang Jiao, Jiarui Jin, et al.

MobilityBench: Ein Benchmark zur Bewertung von Route-Planning-Agenten in realen Mobilitätsszenarien

MobilityBench: Ein Benchmark zur Bewertung von Route-Planning-Agenten in realen Mobilitätsszenarien

Intelligente Fragebeantwortung

Zhiheng Song, Jingshuai Zhang, Chuan Qin, et al.

Von Blindstellen zu Gewinnen: diagnostikgetriebenes iteratives Training für große multimodale Modelle

Von Blindstellen zu Gewinnen: diagnostikgetriebenes iteratives Training für große multimodale Modelle

Hongrui Jia, Chaoya Jiang, Shikun Zhang, et al.

Die Dreifaltigkeit der Konsistenz als definierendes Prinzip für allgemeine Weltmodelle

Die Dreifaltigkeit der Konsistenz als definierendes Prinzip für allgemeine Weltmodelle

Multimodale Darstellung

Jingxuan Wei, Siyuan Li, Yuhang Xu, et al.

GUI-Libra: Training Native GUI Agents to Reason and Act with Action-aware Supervision and Partially Verifiable RL

GUI-Libra: Training Native GUI Agents to Reason and Act with Action-aware Supervision and Partially Verifiable RL

Überwachtes Feinabstimmen

Rui Yang, Qianhui Wu, Zhaoyang Wang, et al.

SkyReels-V4: Mehrmodales Video-Audio-Generierungs-, Inpainting- und Bearbeitungsmodell

SkyReels-V4: Mehrmodales Video-Audio-Generierungs-, Inpainting- und Bearbeitungsmodell

Diffusionsmodell

Guibin Chen, Dixuan Lin, Jiangping Yang, et al.

ARLArena: Ein einheitlicher Rahmen für stabiles agenzienbasiertes Verstärkungslernen

ARLArena: Ein einheitlicher Rahmen für stabiles agenzienbasiertes Verstärkungslernen

Verstärkendes Lernen

Xiaoxuan Wang, Han Zhang, Haixin Wang, et al.

DreamID-Omni: Einheitlicher Rahmen für steuerbare, menschenzentrierte Audio-Video-Generierung

DreamID-Omni: Einheitlicher Rahmen für steuerbare, menschenzentrierte Audio-Video-Generierung

Xu Guo, Fulong Ye, Qichao Sun, et al.