HyperAI

Hauptbereich

GPU

Konsole
Studio
Dokumente
Preise

Pulse

Neuigkeiten

Ressourcen

Fachartikel
Notebooks
Datensätze
Wiki

Benchmarks

SOTA
LLM-Modelle
GPU-Bestenliste

Community

Veranstaltungen

Tools

Über uns Nutzungsbedingungen Datenschutzerklärung
Deutsch

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Täglich aktualisierte hochmoderne KI-Forschungsarbeiten, um Sie über die neuesten KI-Trends auf dem Laufenden zu halten

Gestalten Sie die Zukunft der Künstlichen Intelligenz

Über uns

Über uns Support Hilfe zu Datensätzen

Produkte

Neuigkeiten Fachartikel Notebooks Datensätze Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Hauptbereich

GPU

Konsole
Studio
Dokumente
Preise

Pulse

Neuigkeiten

Ressourcen

Fachartikel
Notebooks
Datensätze
Wiki

Benchmarks

SOTA
LLM-Modelle
GPU-Bestenliste

Community

Veranstaltungen

Tools

Über uns Nutzungsbedingungen Datenschutzerklärung
Deutsch

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Täglich aktualisierte hochmoderne KI-Forschungsarbeiten, um Sie über die neuesten KI-Trends auf dem Laufenden zu halten

Gestalten Sie die Zukunft der Künstlichen Intelligenz

Über uns

Über uns Support Hilfe zu Datensätzen

Produkte

Neuigkeiten Fachartikel Notebooks Datensätze Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

ABot-Earth 0.5: Generatives 3D-Modell der Erde

ABot-Earth 0.5: Generatives 3D-Modell der Erde

Ming Qian, Tianjian Ouyang, Mingchao Sun, et al.

Kwai Keye-VL-2.0 Technischer Bericht

Kwai Keye-VL-2.0 Technischer Bericht

Kwai Keye Team, Bin Wen, Changyi Liu, et al.

TESSERA: Temporale Einbettungen von Oberflächen-spektren zur Darstellung und Analyse der Erde

Multimodale Darstellung

Zhengpeng Feng, Clement Atzberger, Sadiq Jaffer, et al.

Wenn LLMs menschenähnliche Eigenschaften besitzen, dann tut dies auch Age of Empires II.

Adrian de Wynter

Der letzte vom Menschen verfasste Artikel: Agentennative Forschungsartikel

KI Für Die Wissenschaft

Jiachen Liu, Jiaxin Pei, Jintao Huang, et al.

FlashMemory-DeepSeek-V4: Blitzschneller Index ultra-langer Kontexte mittels Vorausschauender Sparse-Aufmerksamkeit

Yan Wang, Qifan Zhang, Jiachen Yu, et al.

LatentSkill: Von Im-Kontext-Textuellen Fähigkeiten zu Im-Gewicht-Latenten Fähigkeiten für LLM Agents

Aofan Yu, Chenyu Zhou, Tianyi Xu, et al.

CoVEBench: Können Videobearbeitungsmodelle komplexe Anweisungen bewältigen?

Jiangtao Wu, Jiaming Wang, Yiwen He, et al.

Latentes räumliches Gedächtnis für Video-Weltmodelle

Diffusionsmodell

Weijie Wang, Haoyu Zhao, Yifan Yang, et al.

Über die Geometrie der On-Policy-Distillation

Zhennan Shen, Yanshu Li, Qingyu Yin, et al.

SWE-Explore: Benchmarking, wie Coding agents Repositories erkunden

Codegenerierung

Shaoqiu Zhang, Yuhang Wang, Jialiang Liang, et al.

Technischer Bericht zu VoxCPM2

Diffusionsmodell

Meituan LongCat Team

ChartNet: Ein Millionen-Skala, hochwertiges multimodales Datenset für robuste Diagramm-Verständnis

Visuelle Fragebeantwortung

Jovana Kondic, Pengyuan Li, Dhiraj Joshi, et al.

ACL-Verbatim: Halluzinationsfreie Fragenbeantwortung für die Forschung

Retrieval-Augmented Generation

Intelligente Fragebeantwortung

Gábor Recski, Szilveszter Tóth, Nadia Verdha, et al.

Jenseits statischer Dialoge: Benchmarking realistischer, heterogener und sich entwickelnder Langzeitgedächtnismodelle

Han Zhang, Zihao Tang, Xin Yu, et al.

Das Ende der Softwareentwicklung: Wie KI-Agenten das Paradigma der Software grundlegend neu strukturieren

Warum größere Modelle mehr lernen: Effekte der Kapazität, der Interferenz und der Aufrechterhaltung seltener Aufgaben

Multi-Task-Lernen

Jing Huang, Daniel Wurgaft, Rachit Bansal, et al.

Wenn Werkzeuge versagen: Benchmarking dynamisches Replanning und Anomaliebewältigung in LLM Agents

Dongsheng Zhu, Xuchen Ma, Yucheng Shen, et al.

Direkte 3D-bewusste Objektinsertion mittels dekomponierter visueller Proxies

Diffusionsmodell

Bildgenerierung

Jingbo Gong, Yikai Wang, Yushi Lan, et al.

AnchorWorld: Verkörperte egozentrische Weltsimulation mit ansichtsbasierter Evolutionanpassung

Körperliche Intelligenz

Yu Li, Menghan Xia, Gongye Liu, et al.

SoCRATES: Zu einer zuverlässigen automatisierten Bewertung proaktiver LLM-Vermittlung über Domänen und sozio-kognitive Variationen hinweg

Taewon Yun, Hyeonseong Park, Jeonghwan Choi, et al.

MMAE: Ein massiver Multitask-Audio-Bearbeitung-Benchmark

Audio- Und Sprachverarbeitung

Ziyang Ma, Ruiqi Yan, Ruiyang Xu, et al.

Ihre UnEmbedding-Matrix ist im Verborgenen eine Merkmalslinse für Texteinbettungen

Songhao Wu, Zhongxin Chen, Yuxuan Liu, et al.

ChordEdit: Ein energieeffizienter Transport in einem Schritt zur Bildbearbeitung

Diffusionsmodell

Liangsi Lu, Xuhang Chen, Minzhe Guo, et al.

NitroGen: Ein offenes Grundlegendes Modell für generalistische Gaming-Agenten

Loïc Magne, Anas Awadalla, Guanzhi Wang, et al.

Effiziente Rekonstruktion dynamischer Szenen – ein D4RT zu einer Zeit

Tiefenschätzung

3D-Maschinenvision

Chuhan Zhang, Guillaume Le Moing, Skanda Koppula, et al.

Continual Learning Bench: Bewertung moderner KI-Systeme in realweltlichen zustandsbehafteten Umgebungen

Parth Asawa, Christopher M. Glaze, Gabriel Orlanski, et al.

MEMORY-CACHING: RNNs mit wachsendem Speicher

Ali Behrouz, Zeman Li, Yuan Deng, et al.

Roboterwerte: Evaluierung von Haushaltsrobotern, wenn menschliche Werte im Konflikt stehen

Jongwook Han, Hyeongjin Kim, Yohan Jo

VideoKR: Hin zu wissens- und reasoningintensivem Video-Verständnis

Visuelle Fragebeantwortung

Lin Fu, Zheyuan Yang, Yang Wang, et al.

AdaPlanBench: Evaluierung adaptiver Planung in Agents großer Sprachmodelle unter Welt- und Benutzerbeschränkungen

Jiayu Liu, Cheng Qian, Zhenhailong Wang, et al.

ABot-Earth 0.5: Generatives 3D-Modell der Erde

ABot-Earth 0.5: Generatives 3D-Modell der Erde

Ming Qian, Tianjian Ouyang, Mingchao Sun, et al.

Kwai Keye-VL-2.0 Technischer Bericht

Kwai Keye-VL-2.0 Technischer Bericht

Kwai Keye Team, Bin Wen, Changyi Liu, et al.

TESSERA: Temporale Einbettungen von Oberflächen-spektren zur Darstellung und Analyse der Erde

Multimodale Darstellung

Zhengpeng Feng, Clement Atzberger, Sadiq Jaffer, et al.

Wenn LLMs menschenähnliche Eigenschaften besitzen, dann tut dies auch Age of Empires II.

Adrian de Wynter

Der letzte vom Menschen verfasste Artikel: Agentennative Forschungsartikel

KI Für Die Wissenschaft

Jiachen Liu, Jiaxin Pei, Jintao Huang, et al.

FlashMemory-DeepSeek-V4: Blitzschneller Index ultra-langer Kontexte mittels Vorausschauender Sparse-Aufmerksamkeit

Yan Wang, Qifan Zhang, Jiachen Yu, et al.

LatentSkill: Von Im-Kontext-Textuellen Fähigkeiten zu Im-Gewicht-Latenten Fähigkeiten für LLM Agents

Aofan Yu, Chenyu Zhou, Tianyi Xu, et al.

CoVEBench: Können Videobearbeitungsmodelle komplexe Anweisungen bewältigen?

Jiangtao Wu, Jiaming Wang, Yiwen He, et al.

Latentes räumliches Gedächtnis für Video-Weltmodelle

Diffusionsmodell

Weijie Wang, Haoyu Zhao, Yifan Yang, et al.

Über die Geometrie der On-Policy-Distillation

Zhennan Shen, Yanshu Li, Qingyu Yin, et al.

SWE-Explore: Benchmarking, wie Coding agents Repositories erkunden

Codegenerierung

Shaoqiu Zhang, Yuhang Wang, Jialiang Liang, et al.

Technischer Bericht zu VoxCPM2

Diffusionsmodell

Meituan LongCat Team

ChartNet: Ein Millionen-Skala, hochwertiges multimodales Datenset für robuste Diagramm-Verständnis

Visuelle Fragebeantwortung

Jovana Kondic, Pengyuan Li, Dhiraj Joshi, et al.

ACL-Verbatim: Halluzinationsfreie Fragenbeantwortung für die Forschung

Retrieval-Augmented Generation

Intelligente Fragebeantwortung

Gábor Recski, Szilveszter Tóth, Nadia Verdha, et al.

Jenseits statischer Dialoge: Benchmarking realistischer, heterogener und sich entwickelnder Langzeitgedächtnismodelle

Han Zhang, Zihao Tang, Xin Yu, et al.

Das Ende der Softwareentwicklung: Wie KI-Agenten das Paradigma der Software grundlegend neu strukturieren

Warum größere Modelle mehr lernen: Effekte der Kapazität, der Interferenz und der Aufrechterhaltung seltener Aufgaben

Multi-Task-Lernen

Jing Huang, Daniel Wurgaft, Rachit Bansal, et al.

Wenn Werkzeuge versagen: Benchmarking dynamisches Replanning und Anomaliebewältigung in LLM Agents

Dongsheng Zhu, Xuchen Ma, Yucheng Shen, et al.

Direkte 3D-bewusste Objektinsertion mittels dekomponierter visueller Proxies

Diffusionsmodell

Bildgenerierung

Jingbo Gong, Yikai Wang, Yushi Lan, et al.

AnchorWorld: Verkörperte egozentrische Weltsimulation mit ansichtsbasierter Evolutionanpassung

Körperliche Intelligenz

Yu Li, Menghan Xia, Gongye Liu, et al.

SoCRATES: Zu einer zuverlässigen automatisierten Bewertung proaktiver LLM-Vermittlung über Domänen und sozio-kognitive Variationen hinweg

Taewon Yun, Hyeonseong Park, Jeonghwan Choi, et al.

MMAE: Ein massiver Multitask-Audio-Bearbeitung-Benchmark

Audio- Und Sprachverarbeitung

Ziyang Ma, Ruiqi Yan, Ruiyang Xu, et al.

Ihre UnEmbedding-Matrix ist im Verborgenen eine Merkmalslinse für Texteinbettungen

Songhao Wu, Zhongxin Chen, Yuxuan Liu, et al.

ChordEdit: Ein energieeffizienter Transport in einem Schritt zur Bildbearbeitung

Diffusionsmodell

Liangsi Lu, Xuhang Chen, Minzhe Guo, et al.

NitroGen: Ein offenes Grundlegendes Modell für generalistische Gaming-Agenten

Loïc Magne, Anas Awadalla, Guanzhi Wang, et al.

Effiziente Rekonstruktion dynamischer Szenen – ein D4RT zu einer Zeit

Tiefenschätzung

3D-Maschinenvision

Chuhan Zhang, Guillaume Le Moing, Skanda Koppula, et al.

Continual Learning Bench: Bewertung moderner KI-Systeme in realweltlichen zustandsbehafteten Umgebungen

Parth Asawa, Christopher M. Glaze, Gabriel Orlanski, et al.

MEMORY-CACHING: RNNs mit wachsendem Speicher

Ali Behrouz, Zeman Li, Yuan Deng, et al.

Roboterwerte: Evaluierung von Haushaltsrobotern, wenn menschliche Werte im Konflikt stehen

Jongwook Han, Hyeongjin Kim, Yohan Jo

VideoKR: Hin zu wissens- und reasoningintensivem Video-Verständnis

Visuelle Fragebeantwortung

Lin Fu, Zheyuan Yang, Yang Wang, et al.

AdaPlanBench: Evaluierung adaptiver Planung in Agents großer Sprachmodelle unter Welt- und Benutzerbeschränkungen

Jiayu Liu, Cheng Qian, Zhenhailong Wang, et al.

TESSERA: Temporale Einbettungen von Oberflächen-spektren zur Darstellung und Analyse der Erde

Wenn LLMs menschenähnliche Eigenschaften besitzen, dann tut dies auch Age of Empires II.

Der letzte vom Menschen verfasste Artikel: Agentennative Forschungsartikel

FlashMemory-DeepSeek-V4: Blitzschneller Index ultra-langer Kontexte mittels Vorausschauender Sparse-Aufmerksamkeit

LatentSkill: Von Im-Kontext-Textuellen Fähigkeiten zu Im-Gewicht-Latenten Fähigkeiten für LLM Agents

CoVEBench: Können Videobearbeitungsmodelle komplexe Anweisungen bewältigen?

Latentes räumliches Gedächtnis für Video-Weltmodelle

Über die Geometrie der On-Policy-Distillation

SWE-Explore: Benchmarking, wie Coding agents Repositories erkunden

Technischer Bericht zu VoxCPM2

Technischer Bericht zu LongCat-Video-Avatar 1.5

ChartNet: Ein Millionen-Skala, hochwertiges multimodales Datenset für robuste Diagramm-Verständnis

ACL-Verbatim: Halluzinationsfreie Fragenbeantwortung für die Forschung

Jenseits statischer Dialoge: Benchmarking realistischer, heterogener und sich entwickelnder Langzeitgedächtnismodelle

Das Ende der Softwareentwicklung: Wie KI-Agenten das Paradigma der Software grundlegend neu strukturieren

Warum größere Modelle mehr lernen: Effekte der Kapazität, der Interferenz und der Aufrechterhaltung seltener Aufgaben

Wenn Werkzeuge versagen: Benchmarking dynamisches Replanning und Anomaliebewältigung in LLM Agents

Direkte 3D-bewusste Objektinsertion mittels dekomponierter visueller Proxies

AnchorWorld: Verkörperte egozentrische Weltsimulation mit ansichtsbasierter Evolutionanpassung

SoCRATES: Zu einer zuverlässigen automatisierten Bewertung proaktiver LLM-Vermittlung über Domänen und sozio-kognitive Variationen hinweg

MMAE: Ein massiver Multitask-Audio-Bearbeitung-Benchmark

Ihre UnEmbedding-Matrix ist im Verborgenen eine Merkmalslinse für Texteinbettungen

ChordEdit: Ein energieeffizienter Transport in einem Schritt zur Bildbearbeitung

NitroGen: Ein offenes Grundlegendes Modell für generalistische Gaming-Agenten

Effiziente Rekonstruktion dynamischer Szenen – ein D4RT zu einer Zeit

Continual Learning Bench: Bewertung moderner KI-Systeme in realweltlichen zustandsbehafteten Umgebungen

MEMORY-CACHING: RNNs mit wachsendem Speicher

Roboterwerte: Evaluierung von Haushaltsrobotern, wenn menschliche Werte im Konflikt stehen

VideoKR: Hin zu wissens- und reasoningintensivem Video-Verständnis

AdaPlanBench: Evaluierung adaptiver Planung in Agents großer Sprachmodelle unter Welt- und Benutzerbeschränkungen

TESSERA: Temporale Einbettungen von Oberflächen-spektren zur Darstellung und Analyse der Erde

Wenn LLMs menschenähnliche Eigenschaften besitzen, dann tut dies auch Age of Empires II.

Der letzte vom Menschen verfasste Artikel: Agentennative Forschungsartikel

FlashMemory-DeepSeek-V4: Blitzschneller Index ultra-langer Kontexte mittels Vorausschauender Sparse-Aufmerksamkeit

LatentSkill: Von Im-Kontext-Textuellen Fähigkeiten zu Im-Gewicht-Latenten Fähigkeiten für LLM Agents

CoVEBench: Können Videobearbeitungsmodelle komplexe Anweisungen bewältigen?

Latentes räumliches Gedächtnis für Video-Weltmodelle

Über die Geometrie der On-Policy-Distillation

SWE-Explore: Benchmarking, wie Coding agents Repositories erkunden

Technischer Bericht zu VoxCPM2

Technischer Bericht zu LongCat-Video-Avatar 1.5

ChartNet: Ein Millionen-Skala, hochwertiges multimodales Datenset für robuste Diagramm-Verständnis

ACL-Verbatim: Halluzinationsfreie Fragenbeantwortung für die Forschung

Jenseits statischer Dialoge: Benchmarking realistischer, heterogener und sich entwickelnder Langzeitgedächtnismodelle

Das Ende der Softwareentwicklung: Wie KI-Agenten das Paradigma der Software grundlegend neu strukturieren

Warum größere Modelle mehr lernen: Effekte der Kapazität, der Interferenz und der Aufrechterhaltung seltener Aufgaben

Wenn Werkzeuge versagen: Benchmarking dynamisches Replanning und Anomaliebewältigung in LLM Agents

Direkte 3D-bewusste Objektinsertion mittels dekomponierter visueller Proxies

AnchorWorld: Verkörperte egozentrische Weltsimulation mit ansichtsbasierter Evolutionanpassung

SoCRATES: Zu einer zuverlässigen automatisierten Bewertung proaktiver LLM-Vermittlung über Domänen und sozio-kognitive Variationen hinweg

MMAE: Ein massiver Multitask-Audio-Bearbeitung-Benchmark

Ihre UnEmbedding-Matrix ist im Verborgenen eine Merkmalslinse für Texteinbettungen

ChordEdit: Ein energieeffizienter Transport in einem Schritt zur Bildbearbeitung

NitroGen: Ein offenes Grundlegendes Modell für generalistische Gaming-Agenten

Effiziente Rekonstruktion dynamischer Szenen – ein D4RT zu einer Zeit

Continual Learning Bench: Bewertung moderner KI-Systeme in realweltlichen zustandsbehafteten Umgebungen

MEMORY-CACHING: RNNs mit wachsendem Speicher

Roboterwerte: Evaluierung von Haushaltsrobotern, wenn menschliche Werte im Konflikt stehen

VideoKR: Hin zu wissens- und reasoningintensivem Video-Verständnis

AdaPlanBench: Evaluierung adaptiver Planung in Agents großer Sprachmodelle unter Welt- und Benutzerbeschränkungen