HyperAI

Hauptbereich

GPU

Konsole
Studio
Dokumente
Preise

Pulse

Neuigkeiten

Ressourcen

Fachartikel
Notebooks
Datensätze
Wiki

Benchmarks

SOTA
LLM-Modelle
GPU-Bestenliste

Community

Veranstaltungen

Tools

Über uns Nutzungsbedingungen Datenschutzerklärung
Deutsch

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Täglich aktualisierte hochmoderne KI-Forschungsarbeiten, um Sie über die neuesten KI-Trends auf dem Laufenden zu halten

Gestalten Sie die Zukunft der Künstlichen Intelligenz

Über uns

Über uns Support Hilfe zu Datensätzen

Produkte

Neuigkeiten Fachartikel Notebooks Datensätze Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Hauptbereich

GPU

Konsole
Studio
Dokumente
Preise

Pulse

Neuigkeiten

Ressourcen

Fachartikel
Notebooks
Datensätze
Wiki

Benchmarks

SOTA
LLM-Modelle
GPU-Bestenliste

Community

Veranstaltungen

Tools

Über uns Nutzungsbedingungen Datenschutzerklärung
Deutsch

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Täglich aktualisierte hochmoderne KI-Forschungsarbeiten, um Sie über die neuesten KI-Trends auf dem Laufenden zu halten

Gestalten Sie die Zukunft der Künstlichen Intelligenz

Über uns

Über uns Support Hilfe zu Datensätzen

Produkte

Neuigkeiten Fachartikel Notebooks Datensätze Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

MEMORY-CACHING: RNNs mit wachsendem Speicher

MEMORY-CACHING: RNNs mit wachsendem Speicher

Ali Behrouz, Zeman Li, Yuan Deng, et al.

Roboterwerte: Evaluierung von Haushaltsrobotern, wenn menschliche Werte im Konflikt stehen

Roboterwerte: Evaluierung von Haushaltsrobotern, wenn menschliche Werte im Konflikt stehen

Jongwook Han, Hyeongjin Kim, Yohan Jo

VideoKR: Hin zu wissens- und reasoningintensivem Video-Verständnis

Visuelle Fragebeantwortung

Lin Fu, Zheyuan Yang, Yang Wang, et al.

AdaPlanBench: Evaluierung adaptiver Planung in Agents großer Sprachmodelle unter Welt- und Benutzerbeschränkungen

Jiayu Liu, Cheng Qian, Zhenhailong Wang, et al.

TIDE: Proaktive Multi-Problementdeckung mittels Vorlagen-gesteuerter Iteration

Soyeong Jeong, Jinheon Baek, Minki Kang, et al.

ArcANE: Bleiben Language Agents im Rollenspiel zur richtigen Zeit in Charakter?

Woojung Song, Nalim Kim, Sangjun Song, et al.

Code2LoRA: Hypernetzwerk-generierte Adapter für Code-Sprachmodelle unter Softwareevolution

Codegenerierung

Liliana Hotsko, Yinxi Li, Yuntian Deng, et al.

Selbstdistillierter Policy Gradient

Verstärkendes Lernen

Yifeng Liu, Shiyouan Zhang, Yifan Zhang, et al.

GSM-Symbolic: Das Verständnis der Einschränkungen der mathematischen Schlussfolgerung in großen Sprachmodellen

Iman Mirzadeh, Keivan Alizadeh, Oncel Tuzel, et al.

MUSE-Autoskill: Selbstentwickelnde Agenten durch Fertigkeitserstellung, Gedächtnis, Management und Evaluation

Huawei Lin, Peng Li, Jie Song, et al.

Nemotron 3 Ultra: Open-Source, effizientes Mixture-of-Experts-Hybridmodell aus Mamba und Transformer für agentic reasoning

Akter et al., Xiao et al., Liu et al., et al.

Qwen-Image-Flash: Jenseits des objektiven Designs

Bildgenerierung

Tianhe Wu, Kun Yan, Zikai Zhou, et al.

OVO-S-Bench: Ein hierarchisches Benchmark für Streaming-Raumintelligenz in multimodalen LLMs

Yifei Li, Pengyiang Liu, Yuhang Zang, et al.

Reproduktion, Analyse und Detektion von Reward Hacking in rubrikbasiertem Verstärkungslernen

Verstärkendes Lernen

Xuekang Wang, Zhuoyuan Hao, Shuo Hou, et al.

Wo gehen Deep-Research-Agents falsch? Span-Ebene-Fehlerlokalisierung in Agent-Trajektorien

Jiaming Wang, Ziteng Feng, Jiangtao Wu, et al.

Audio-Interaktionsmodell

Audio- Und Sprachverarbeitung

Zhifei Xie, Zihang Liu, Ze An, et al.

Cosmos 3: Omnimodale Weltmodelle für physische KI

Aditi, Niket Agarwal, Arslan Ali, et al.

Lernen, schnell und langsam: Auf dem Weg zu LLMs, die sich kontinuierlich anpassen

Überwachtes Feinabstimmen

Rishabh Tiwari, Kusha Sareen, Lakshya A Agrawal, et al.

LEAP: Beschleunigung von LLMs für formale Mathematik mit agentic frameworks

Textgenerierung

Po-Nien Kung, Linfeng Song, Dawsen Hwang, et al.

Weltmodelle treffen auf Sprachmodelle: Zur Komplementarität von konkretem und abstraktem Denken

Visuelle Fragebeantwortung

Yucheng Zhou, Wei Tao, Yiwen Guo, et al.

Von Aktivierung zu Kausalität: Entdeckung kausaler visueller Repräsentationen im menschlichen Gehirn

Bildgenerierung

Multimodale Darstellung

Yuval Golbari, Navve Wasserman, Matias Cosarinsky, et al.

Eine lokale Störungstheorie für domänenübergreifende Interferenz und Wiederherstellung in Multi-Domain-RL

Verstärkendes Lernen

Lei Yang, Siyu Ding, Deyi Xiong

Humanoid-GPT: Skalierung von Daten und Struktur für Zero-Shot-Bewegungsverfolgung

Objektverfolgung

Zekun Qi, Xuchuan Chen, Dairu Liu, et al.

Vertrauensbereich On-Policy Distillation

Textgenerierung

Xingrun Xing, Haoqing Wang, Boyan Gao, et al.

OCC-RAG: Optimaler kognitiver Kern für treue Fragenbeantwortung

Retrieval-Augmented Generation

Intelligente Fragebeantwortung

Maksim Savkin, Mikhail Goncharov, Alexander Gambashidze, et al.

MAI-Thinking-1: Entwicklung einer Hill-Climbing-Maschine

$VLM^3$: Visuell-Sprachmodelle sind nativ 3D-Lerner

Tiefenschätzung

Zhipeng Cai, Zhuang Liu, Yunyang Xiong, et al.

Harness-1: Verstärkungslernen für Suchagenten mit zustandsauslagernden Harnesses

Retrieval-Augmented Generation

Pengcheng Jiang, Zhiyi Shi, Kelly Hong, et al.

DeepCrack: Eine tiefe hierarchische Merkmalslernalchitektur zur Segmentierung von Rissen

Semantische Segmentierung

Bildsegmentierung

Yahui Liu, Lian Yao, Xiaohu Lu, et al.

VideoMLA: Niedrigrangiger Latenter KV-Cache für Minuten-Skalen-Autoregressive Video-Diffusion

Diffusionsmodell

Hidir Yesiltepe, Jiazhen Hu, Tuna Han Salih Meral, et al.

Draft-OPD: On-Policy Distillation für spekulative Entwurfsmodelle

Textgenerierung

Haodi Lei, Yafy Li, Haoran Zhang, et al.

K-BrowseComp: Ein Web-Browsing-Agent-Benchmark, der in koreanischen Kontexten verankert ist

Nahyun Lee, Dongkeun Yoon, Guijin Son, et al.

MEMORY-CACHING: RNNs mit wachsendem Speicher

MEMORY-CACHING: RNNs mit wachsendem Speicher

Ali Behrouz, Zeman Li, Yuan Deng, et al.

Roboterwerte: Evaluierung von Haushaltsrobotern, wenn menschliche Werte im Konflikt stehen

Roboterwerte: Evaluierung von Haushaltsrobotern, wenn menschliche Werte im Konflikt stehen

Jongwook Han, Hyeongjin Kim, Yohan Jo

VideoKR: Hin zu wissens- und reasoningintensivem Video-Verständnis

Visuelle Fragebeantwortung

Lin Fu, Zheyuan Yang, Yang Wang, et al.

AdaPlanBench: Evaluierung adaptiver Planung in Agents großer Sprachmodelle unter Welt- und Benutzerbeschränkungen

Jiayu Liu, Cheng Qian, Zhenhailong Wang, et al.

TIDE: Proaktive Multi-Problementdeckung mittels Vorlagen-gesteuerter Iteration

Soyeong Jeong, Jinheon Baek, Minki Kang, et al.

ArcANE: Bleiben Language Agents im Rollenspiel zur richtigen Zeit in Charakter?

Woojung Song, Nalim Kim, Sangjun Song, et al.

Code2LoRA: Hypernetzwerk-generierte Adapter für Code-Sprachmodelle unter Softwareevolution

Codegenerierung

Liliana Hotsko, Yinxi Li, Yuntian Deng, et al.

Selbstdistillierter Policy Gradient

Verstärkendes Lernen

Yifeng Liu, Shiyouan Zhang, Yifan Zhang, et al.

GSM-Symbolic: Das Verständnis der Einschränkungen der mathematischen Schlussfolgerung in großen Sprachmodellen

Iman Mirzadeh, Keivan Alizadeh, Oncel Tuzel, et al.

MUSE-Autoskill: Selbstentwickelnde Agenten durch Fertigkeitserstellung, Gedächtnis, Management und Evaluation

Huawei Lin, Peng Li, Jie Song, et al.

Nemotron 3 Ultra: Open-Source, effizientes Mixture-of-Experts-Hybridmodell aus Mamba und Transformer für agentic reasoning

Akter et al., Xiao et al., Liu et al., et al.

Qwen-Image-Flash: Jenseits des objektiven Designs

Bildgenerierung

Tianhe Wu, Kun Yan, Zikai Zhou, et al.

OVO-S-Bench: Ein hierarchisches Benchmark für Streaming-Raumintelligenz in multimodalen LLMs

Yifei Li, Pengyiang Liu, Yuhang Zang, et al.

Reproduktion, Analyse und Detektion von Reward Hacking in rubrikbasiertem Verstärkungslernen

Verstärkendes Lernen

Xuekang Wang, Zhuoyuan Hao, Shuo Hou, et al.

Wo gehen Deep-Research-Agents falsch? Span-Ebene-Fehlerlokalisierung in Agent-Trajektorien

Jiaming Wang, Ziteng Feng, Jiangtao Wu, et al.

Audio-Interaktionsmodell

Audio- Und Sprachverarbeitung

Zhifei Xie, Zihang Liu, Ze An, et al.

Cosmos 3: Omnimodale Weltmodelle für physische KI

Aditi, Niket Agarwal, Arslan Ali, et al.

Lernen, schnell und langsam: Auf dem Weg zu LLMs, die sich kontinuierlich anpassen

Überwachtes Feinabstimmen

Rishabh Tiwari, Kusha Sareen, Lakshya A Agrawal, et al.

LEAP: Beschleunigung von LLMs für formale Mathematik mit agentic frameworks

Textgenerierung

Po-Nien Kung, Linfeng Song, Dawsen Hwang, et al.

Weltmodelle treffen auf Sprachmodelle: Zur Komplementarität von konkretem und abstraktem Denken

Visuelle Fragebeantwortung

Yucheng Zhou, Wei Tao, Yiwen Guo, et al.

Von Aktivierung zu Kausalität: Entdeckung kausaler visueller Repräsentationen im menschlichen Gehirn

Bildgenerierung

Multimodale Darstellung

Yuval Golbari, Navve Wasserman, Matias Cosarinsky, et al.

Eine lokale Störungstheorie für domänenübergreifende Interferenz und Wiederherstellung in Multi-Domain-RL

Verstärkendes Lernen

Lei Yang, Siyu Ding, Deyi Xiong

Humanoid-GPT: Skalierung von Daten und Struktur für Zero-Shot-Bewegungsverfolgung

Objektverfolgung

Zekun Qi, Xuchuan Chen, Dairu Liu, et al.

Vertrauensbereich On-Policy Distillation

Textgenerierung

Xingrun Xing, Haoqing Wang, Boyan Gao, et al.

OCC-RAG: Optimaler kognitiver Kern für treue Fragenbeantwortung

Retrieval-Augmented Generation

Intelligente Fragebeantwortung

Maksim Savkin, Mikhail Goncharov, Alexander Gambashidze, et al.

MAI-Thinking-1: Entwicklung einer Hill-Climbing-Maschine

$VLM^3$: Visuell-Sprachmodelle sind nativ 3D-Lerner

Tiefenschätzung

Zhipeng Cai, Zhuang Liu, Yunyang Xiong, et al.

Harness-1: Verstärkungslernen für Suchagenten mit zustandsauslagernden Harnesses

Retrieval-Augmented Generation

Pengcheng Jiang, Zhiyi Shi, Kelly Hong, et al.

DeepCrack: Eine tiefe hierarchische Merkmalslernalchitektur zur Segmentierung von Rissen

Semantische Segmentierung

Bildsegmentierung

Yahui Liu, Lian Yao, Xiaohu Lu, et al.

VideoMLA: Niedrigrangiger Latenter KV-Cache für Minuten-Skalen-Autoregressive Video-Diffusion

Diffusionsmodell

Hidir Yesiltepe, Jiazhen Hu, Tuna Han Salih Meral, et al.

Draft-OPD: On-Policy Distillation für spekulative Entwurfsmodelle

Textgenerierung

Haodi Lei, Yafy Li, Haoran Zhang, et al.

K-BrowseComp: Ein Web-Browsing-Agent-Benchmark, der in koreanischen Kontexten verankert ist

Nahyun Lee, Dongkeun Yoon, Guijin Son, et al.

VideoKR: Hin zu wissens- und reasoningintensivem Video-Verständnis

AdaPlanBench: Evaluierung adaptiver Planung in Agents großer Sprachmodelle unter Welt- und Benutzerbeschränkungen

TIDE: Proaktive Multi-Problementdeckung mittels Vorlagen-gesteuerter Iteration

ArcANE: Bleiben Language Agents im Rollenspiel zur richtigen Zeit in Charakter?

Code2LoRA: Hypernetzwerk-generierte Adapter für Code-Sprachmodelle unter Softwareevolution

Selbstdistillierter Policy Gradient

GSM-Symbolic: Das Verständnis der Einschränkungen der mathematischen Schlussfolgerung in großen Sprachmodellen

MUSE-Autoskill: Selbstentwickelnde Agenten durch Fertigkeitserstellung, Gedächtnis, Management und Evaluation

Nemotron 3 Ultra: Open-Source, effizientes Mixture-of-Experts-Hybridmodell aus Mamba und Transformer für agentic reasoning

Qwen-Image-Flash: Jenseits des objektiven Designs

OVO-S-Bench: Ein hierarchisches Benchmark für Streaming-Raumintelligenz in multimodalen LLMs

Reproduktion, Analyse und Detektion von Reward Hacking in rubrikbasiertem Verstärkungslernen

Wo gehen Deep-Research-Agents falsch? Span-Ebene-Fehlerlokalisierung in Agent-Trajektorien

Audio-Interaktionsmodell

Cosmos 3: Omnimodale Weltmodelle für physische KI

Lernen, schnell und langsam: Auf dem Weg zu LLMs, die sich kontinuierlich anpassen

LEAP: Beschleunigung von LLMs für formale Mathematik mit agentic frameworks

Weltmodelle treffen auf Sprachmodelle: Zur Komplementarität von konkretem und abstraktem Denken

Von Aktivierung zu Kausalität: Entdeckung kausaler visueller Repräsentationen im menschlichen Gehirn

Eine lokale Störungstheorie für domänenübergreifende Interferenz und Wiederherstellung in Multi-Domain-RL

Humanoid-GPT: Skalierung von Daten und Struktur für Zero-Shot-Bewegungsverfolgung

Vertrauensbereich On-Policy Distillation

OCC-RAG: Optimaler kognitiver Kern für treue Fragenbeantwortung

MAI-Thinking-1: Entwicklung einer Hill-Climbing-Maschine

$VLM^3$ : Visuell-Sprachmodelle sind nativ 3D-Lerner

Harness-1: Verstärkungslernen für Suchagenten mit zustandsauslagernden Harnesses

DeepCrack: Eine tiefe hierarchische Merkmalslernalchitektur zur Segmentierung von Rissen

VideoMLA: Niedrigrangiger Latenter KV-Cache für Minuten-Skalen-Autoregressive Video-Diffusion

Draft-OPD: On-Policy Distillation für spekulative Entwurfsmodelle

K-BrowseComp: Ein Web-Browsing-Agent-Benchmark, der in koreanischen Kontexten verankert ist

VideoKR: Hin zu wissens- und reasoningintensivem Video-Verständnis

AdaPlanBench: Evaluierung adaptiver Planung in Agents großer Sprachmodelle unter Welt- und Benutzerbeschränkungen

TIDE: Proaktive Multi-Problementdeckung mittels Vorlagen-gesteuerter Iteration

ArcANE: Bleiben Language Agents im Rollenspiel zur richtigen Zeit in Charakter?

Code2LoRA: Hypernetzwerk-generierte Adapter für Code-Sprachmodelle unter Softwareevolution

Selbstdistillierter Policy Gradient

GSM-Symbolic: Das Verständnis der Einschränkungen der mathematischen Schlussfolgerung in großen Sprachmodellen

MUSE-Autoskill: Selbstentwickelnde Agenten durch Fertigkeitserstellung, Gedächtnis, Management und Evaluation

Nemotron 3 Ultra: Open-Source, effizientes Mixture-of-Experts-Hybridmodell aus Mamba und Transformer für agentic reasoning

Qwen-Image-Flash: Jenseits des objektiven Designs

OVO-S-Bench: Ein hierarchisches Benchmark für Streaming-Raumintelligenz in multimodalen LLMs

Reproduktion, Analyse und Detektion von Reward Hacking in rubrikbasiertem Verstärkungslernen

Wo gehen Deep-Research-Agents falsch? Span-Ebene-Fehlerlokalisierung in Agent-Trajektorien

Audio-Interaktionsmodell

Cosmos 3: Omnimodale Weltmodelle für physische KI

Lernen, schnell und langsam: Auf dem Weg zu LLMs, die sich kontinuierlich anpassen

LEAP: Beschleunigung von LLMs für formale Mathematik mit agentic frameworks

Weltmodelle treffen auf Sprachmodelle: Zur Komplementarität von konkretem und abstraktem Denken

Von Aktivierung zu Kausalität: Entdeckung kausaler visueller Repräsentationen im menschlichen Gehirn

Eine lokale Störungstheorie für domänenübergreifende Interferenz und Wiederherstellung in Multi-Domain-RL

Humanoid-GPT: Skalierung von Daten und Struktur für Zero-Shot-Bewegungsverfolgung

Vertrauensbereich On-Policy Distillation

OCC-RAG: Optimaler kognitiver Kern für treue Fragenbeantwortung

MAI-Thinking-1: Entwicklung einer Hill-Climbing-Maschine

$VLM^3$ : Visuell-Sprachmodelle sind nativ 3D-Lerner

Harness-1: Verstärkungslernen für Suchagenten mit zustandsauslagernden Harnesses

DeepCrack: Eine tiefe hierarchische Merkmalslernalchitektur zur Segmentierung von Rissen

VideoMLA: Niedrigrangiger Latenter KV-Cache für Minuten-Skalen-Autoregressive Video-Diffusion

Draft-OPD: On-Policy Distillation für spekulative Entwurfsmodelle

K-BrowseComp: Ein Web-Browsing-Agent-Benchmark, der in koreanischen Kontexten verankert ist