HyperAI

Hauptbereich

GPU

Konsole
Studio
Dokumente
Preise

Pulse

Neuigkeiten

Ressourcen

Fachartikel
Notebooks
Datensätze
Wiki

Benchmarks

SOTA
LLM-Modelle
GPU-Bestenliste

Community

Veranstaltungen

Tools

Über uns Nutzungsbedingungen Datenschutzerklärung
Deutsch

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Täglich aktualisierte hochmoderne KI-Forschungsarbeiten, um Sie über die neuesten KI-Trends auf dem Laufenden zu halten

Gestalten Sie die Zukunft der Künstlichen Intelligenz

Über uns

Über uns Support Hilfe zu Datensätzen

Produkte

Neuigkeiten Fachartikel Notebooks Datensätze Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Hauptbereich

GPU

Konsole
Studio
Dokumente
Preise

Pulse

Neuigkeiten

Ressourcen

Fachartikel
Notebooks
Datensätze
Wiki

Benchmarks

SOTA
LLM-Modelle
GPU-Bestenliste

Community

Veranstaltungen

Tools

Über uns Nutzungsbedingungen Datenschutzerklärung
Deutsch

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Täglich aktualisierte hochmoderne KI-Forschungsarbeiten, um Sie über die neuesten KI-Trends auf dem Laufenden zu halten

Gestalten Sie die Zukunft der Künstlichen Intelligenz

Über uns

Über uns Support Hilfe zu Datensätzen

Produkte

Neuigkeiten Fachartikel Notebooks Datensätze Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

LLaVA-UHD v4: Was macht das effiziente visuelle Encoding in MLLMs aus?

LLaVA-UHD v4: Was macht das effiziente visuelle Encoding in MLLMs aus?

Multimodale Darstellung

Kechen Fang, Yihua Qin, Chongyi Wang, et al.

Entlarvung der On-Policy-Distillation: Wo sie hilft, wo sie schadet und warum

Entlarvung der On-Policy-Distillation: Wo sie hilft, wo sie schadet und warum

Mohammadreza Armandpour, Fatih Ilhan, David Harrison, et al.

Ein einzelnes Neuron genügt, um die Sicherheitsausrichtung in großen Sprachmodellen zu umgehen

Textgenerierung

Hamid Kazemi, Atoosa Chegini, Maria Safi

SlimQwen: Untersuchung der Pruning- und Distillationsmethoden in der Vorverarbeitung großer MoE-Modelle

Shengkun Tang, Zekun Wang, Bo Zheng, et al.

ELF: Eingebettete Sprachflüsse

Diffusionsmodell

Textgenerierung

Keya Hu, Linlu Qiu, Yiyang Lu, et al.

PaperFit: Optimierung der Satzstruktur wissenschaftlicher Dokumente durch visuelles Feedback

Dokumentenverstehen

Bihui Yu, Xinglong Xu, Junjie Jiang, et al.

Rubrikbasierte On-Policy-Distillation

Junfeng Fang, Zhepei Hong, Mao Zheng, et al.

CollabVR: Kollaborative Videorationalität mit visuell-sprachlichen und videogenerativen Modellen

Joowon Kim, Seungho Shin, Joonhyung Park, et al.

TMAS: Skalierung der Rechenleistung zur Testzeit durch Multi-Agent-Synergie

George Wu, Nan Jing, Qing Yi, et al.

Soohak: Ein von Mathematikern kuratierter Benchmark zur Bewertung der mathematischen Fähigkeiten auf Forschungsstufe von LLMs

Guijin Son, Seungone Kim, Catherine Arnett, et al.

Technischer Bericht zu Qwen-Image-2.0

Bing Zhao, Chenfei Wu, Deqing Li, et al.

MiniCPM-o 4.5: Auf dem Weg zu einer Echtzeit-Voll-Duplex-Omni-Modal-Interaktion

Junbo Cui, Bokai Xu, Chongyi Wang, et al.

Lernen während des Einsatzes: Fleet-Skalierbare Bestärkungslernen-Verfahren für allgemeine Roboterpolicies

Verstärkendes Lernen

Yi Wang, Xincheng Li, Pengwei Xie, et al.

Fast Byte Latent Transformer

Textgenerierung

Diffusionsmodell

Julie Kallini, Artidoro Pagnoni, Tomasz Limisiewicz, et al.

KI-Mitmathematiker: Beschleunigung von Mathematikern durch agentic AI

KI Für Die Wissenschaft

Daniel Zheng, Ingrid von Glehn, Yori Zwols, et al.

HyperEyes: Dual-Grained Efficiency-Aware Reinforcement Learning für Parallele Multimodale Search Agents

Retrieval-Augmented Generation

Guankai Li, Jiabin Chen, Yi Xu, et al.

Mean-Modus-Schreien: Mittelwert-Varianz-aufgeteilte Residuen für 1000-Schicht-Diffusions-Transformers

Diffusionsmodell

LLMs verbessern LLMs: Agentic Discovery für Test-Time Scaling

Tong Zheng, Haolin Liu, Chengsong Huang, et al.

List-basierte Politikoptimierung: Gruppenbasierte RLVR als Zielprojektion auf das LLM-Antwort-Simplex

Verstärkendes Lernen

Yun Qu, Qi Wang, Yixiu Mao, et al.

Flow-OPD: On-Policy-Distillation für Flow-Matching-Modelle

Diffusionsmodell

Zhen Fang, Wenxuan Huang, Yu Zeng, et al.

MACE-Dance: Bewegungs- und Erscheinungs-Kaskadierende Experten für musikgetriebene Tanzvideogenerierung

Diffusionsmodell

Kaixing Yang, Jiashu Zhu, Xulong Tang, et al.

Erneutes Überdenken reasoning-intensiver Abrufmethoden: Bewertung und Verbesserung von Retrievers in agentic Search-Systemen

Retrieval-Augmented Generation

Yilun Zhao, Jinbiao Wei, Tingyu Song, et al.

Wann ist der Phantasie zu vertrauen: Adaptive Handlungsexecution für World Action Models

Rui Wang, Yue Zhang, Jiehong Lin, et al.

RaguTeam bei SemEval-2026 Aufgabe 8: Meno und Freunde in einem von einem Richter orchestrierten LLM-Ensemble für glaubwürdige Mehrfachantwort-Generierung

Intelligente Fragebeantwortung

Textgenerierung

Ivan Bondarenko, Roman Derunets, Oleg Sedukhin, et al.

MiA-Signatur: Annäherung an globale Aktivität zum Verständnis langer Kontexte

Retrieval-Augmented Generation

Yuqing Li, Jiangnan Li, Mo Yu, et al.

Continuous Latent Diffusion Language Model

Hongcan Guo, Qinyu Zhao, Yian Zhao, et al.

Fähigkeit 1: Unified Evolution von mit Fähigkeiten erweiterten Agents durch Reinforcement Learning

Verstärkendes Lernen

Yaorui Shi, Yuxin Chen, Zhengxi Lu, et al.

Über die semantische Ähnlichkeit hinaus: Eine Neubewertung der retrieval-basierten Suche für agentic Search durch direkte Interaktion mit dem Korpus

Retrieval-Augmented Generation

Zhuofeng Li, Haoxiang Zhang, Cong Wei, et al.

MathNet: Ein globaler Multimodal-Benchmark für mathematisches Reasoning und Retrieval

Retrieval-Augmented Generation

Shaden Alshammari, Kevin Wen, Abrar Zainal, et al.

D-OPSD: On-Policy Selbst-Distillation zur kontinuierlichen Feinabstimmung von step-distilled Diffusion Modellen

Diffusionsmodell

Überwachtes Feinabstimmen

Dongyang Jiang, Xin Jin, Dongyang Liu, et al.

ZAYA1-8B Technischer Bericht

Überwachtes Feinabstimmen

Robert Washbourne, Rishi Iyer, Tomas Figliolia, et al.

PhysForge: Generierung physikalisch fundierter 3D-Assets für interaktive virtuelle Welten

Diffusionsmodell

Yunhan Yang, Chunshi Wang, Junliang Ye, et al.

LLaVA-UHD v4: Was macht das effiziente visuelle Encoding in MLLMs aus?

LLaVA-UHD v4: Was macht das effiziente visuelle Encoding in MLLMs aus?

Multimodale Darstellung

Kechen Fang, Yihua Qin, Chongyi Wang, et al.

Entlarvung der On-Policy-Distillation: Wo sie hilft, wo sie schadet und warum

Entlarvung der On-Policy-Distillation: Wo sie hilft, wo sie schadet und warum

Mohammadreza Armandpour, Fatih Ilhan, David Harrison, et al.

Ein einzelnes Neuron genügt, um die Sicherheitsausrichtung in großen Sprachmodellen zu umgehen

Textgenerierung

Hamid Kazemi, Atoosa Chegini, Maria Safi

SlimQwen: Untersuchung der Pruning- und Distillationsmethoden in der Vorverarbeitung großer MoE-Modelle

Shengkun Tang, Zekun Wang, Bo Zheng, et al.

ELF: Eingebettete Sprachflüsse

Diffusionsmodell

Textgenerierung

Keya Hu, Linlu Qiu, Yiyang Lu, et al.

PaperFit: Optimierung der Satzstruktur wissenschaftlicher Dokumente durch visuelles Feedback

Dokumentenverstehen

Bihui Yu, Xinglong Xu, Junjie Jiang, et al.

Rubrikbasierte On-Policy-Distillation

Junfeng Fang, Zhepei Hong, Mao Zheng, et al.

CollabVR: Kollaborative Videorationalität mit visuell-sprachlichen und videogenerativen Modellen

Joowon Kim, Seungho Shin, Joonhyung Park, et al.

TMAS: Skalierung der Rechenleistung zur Testzeit durch Multi-Agent-Synergie

George Wu, Nan Jing, Qing Yi, et al.

Soohak: Ein von Mathematikern kuratierter Benchmark zur Bewertung der mathematischen Fähigkeiten auf Forschungsstufe von LLMs

Guijin Son, Seungone Kim, Catherine Arnett, et al.

Technischer Bericht zu Qwen-Image-2.0

Bing Zhao, Chenfei Wu, Deqing Li, et al.

MiniCPM-o 4.5: Auf dem Weg zu einer Echtzeit-Voll-Duplex-Omni-Modal-Interaktion

Junbo Cui, Bokai Xu, Chongyi Wang, et al.

Lernen während des Einsatzes: Fleet-Skalierbare Bestärkungslernen-Verfahren für allgemeine Roboterpolicies

Verstärkendes Lernen

Yi Wang, Xincheng Li, Pengwei Xie, et al.

Fast Byte Latent Transformer

Textgenerierung

Diffusionsmodell

Julie Kallini, Artidoro Pagnoni, Tomasz Limisiewicz, et al.

KI-Mitmathematiker: Beschleunigung von Mathematikern durch agentic AI

KI Für Die Wissenschaft

Daniel Zheng, Ingrid von Glehn, Yori Zwols, et al.

HyperEyes: Dual-Grained Efficiency-Aware Reinforcement Learning für Parallele Multimodale Search Agents

Retrieval-Augmented Generation

Guankai Li, Jiabin Chen, Yi Xu, et al.

Mean-Modus-Schreien: Mittelwert-Varianz-aufgeteilte Residuen für 1000-Schicht-Diffusions-Transformers

Diffusionsmodell

LLMs verbessern LLMs: Agentic Discovery für Test-Time Scaling

Tong Zheng, Haolin Liu, Chengsong Huang, et al.

List-basierte Politikoptimierung: Gruppenbasierte RLVR als Zielprojektion auf das LLM-Antwort-Simplex

Verstärkendes Lernen

Yun Qu, Qi Wang, Yixiu Mao, et al.

Flow-OPD: On-Policy-Distillation für Flow-Matching-Modelle

Diffusionsmodell

Zhen Fang, Wenxuan Huang, Yu Zeng, et al.

MACE-Dance: Bewegungs- und Erscheinungs-Kaskadierende Experten für musikgetriebene Tanzvideogenerierung

Diffusionsmodell

Kaixing Yang, Jiashu Zhu, Xulong Tang, et al.

Erneutes Überdenken reasoning-intensiver Abrufmethoden: Bewertung und Verbesserung von Retrievers in agentic Search-Systemen

Retrieval-Augmented Generation

Yilun Zhao, Jinbiao Wei, Tingyu Song, et al.

Wann ist der Phantasie zu vertrauen: Adaptive Handlungsexecution für World Action Models

Rui Wang, Yue Zhang, Jiehong Lin, et al.

RaguTeam bei SemEval-2026 Aufgabe 8: Meno und Freunde in einem von einem Richter orchestrierten LLM-Ensemble für glaubwürdige Mehrfachantwort-Generierung

Intelligente Fragebeantwortung

Textgenerierung

Ivan Bondarenko, Roman Derunets, Oleg Sedukhin, et al.

MiA-Signatur: Annäherung an globale Aktivität zum Verständnis langer Kontexte

Retrieval-Augmented Generation

Yuqing Li, Jiangnan Li, Mo Yu, et al.

Continuous Latent Diffusion Language Model

Hongcan Guo, Qinyu Zhao, Yian Zhao, et al.

Fähigkeit 1: Unified Evolution von mit Fähigkeiten erweiterten Agents durch Reinforcement Learning

Verstärkendes Lernen

Yaorui Shi, Yuxin Chen, Zhengxi Lu, et al.

Über die semantische Ähnlichkeit hinaus: Eine Neubewertung der retrieval-basierten Suche für agentic Search durch direkte Interaktion mit dem Korpus

Retrieval-Augmented Generation

Zhuofeng Li, Haoxiang Zhang, Cong Wei, et al.

MathNet: Ein globaler Multimodal-Benchmark für mathematisches Reasoning und Retrieval

Retrieval-Augmented Generation

Shaden Alshammari, Kevin Wen, Abrar Zainal, et al.

D-OPSD: On-Policy Selbst-Distillation zur kontinuierlichen Feinabstimmung von step-distilled Diffusion Modellen

Diffusionsmodell

Überwachtes Feinabstimmen

Dongyang Jiang, Xin Jin, Dongyang Liu, et al.

ZAYA1-8B Technischer Bericht

Überwachtes Feinabstimmen

Robert Washbourne, Rishi Iyer, Tomas Figliolia, et al.

PhysForge: Generierung physikalisch fundierter 3D-Assets für interaktive virtuelle Welten

Diffusionsmodell

Yunhan Yang, Chunshi Wang, Junliang Ye, et al.

Ein einzelnes Neuron genügt, um die Sicherheitsausrichtung in großen Sprachmodellen zu umgehen

SlimQwen: Untersuchung der Pruning- und Distillationsmethoden in der Vorverarbeitung großer MoE-Modelle

ELF: Eingebettete Sprachflüsse

PaperFit: Optimierung der Satzstruktur wissenschaftlicher Dokumente durch visuelles Feedback

Rubrikbasierte On-Policy-Distillation

CollabVR: Kollaborative Videorationalität mit visuell-sprachlichen und videogenerativen Modellen

TMAS: Skalierung der Rechenleistung zur Testzeit durch Multi-Agent-Synergie

Soohak: Ein von Mathematikern kuratierter Benchmark zur Bewertung der mathematischen Fähigkeiten auf Forschungsstufe von LLMs

Technischer Bericht zu Qwen-Image-2.0

MiniCPM-o 4.5: Auf dem Weg zu einer Echtzeit-Voll-Duplex-Omni-Modal-Interaktion

Lernen während des Einsatzes: Fleet-Skalierbare Bestärkungslernen-Verfahren für allgemeine Roboterpolicies

Fast Byte Latent Transformer

KI-Mitmathematiker: Beschleunigung von Mathematikern durch agentic AI

HyperEyes: Dual-Grained Efficiency-Aware Reinforcement Learning für Parallele Multimodale Search Agents

Mean-Modus-Schreien: Mittelwert-Varianz-aufgeteilte Residuen für 1000-Schicht-Diffusions-Transformers

LLMs verbessern LLMs: Agentic Discovery für Test-Time Scaling

List-basierte Politikoptimierung: Gruppenbasierte RLVR als Zielprojektion auf das LLM-Antwort-Simplex

Flow-OPD: On-Policy-Distillation für Flow-Matching-Modelle

MACE-Dance: Bewegungs- und Erscheinungs-Kaskadierende Experten für musikgetriebene Tanzvideogenerierung

Erneutes Überdenken reasoning-intensiver Abrufmethoden: Bewertung und Verbesserung von Retrievers in agentic Search-Systemen

Wann ist der Phantasie zu vertrauen: Adaptive Handlungsexecution für World Action Models

RaguTeam bei SemEval-2026 Aufgabe 8: Meno und Freunde in einem von einem Richter orchestrierten LLM-Ensemble für glaubwürdige Mehrfachantwort-Generierung

MiA-Signatur: Annäherung an globale Aktivität zum Verständnis langer Kontexte

Continuous Latent Diffusion Language Model

Fähigkeit 1: Unified Evolution von mit Fähigkeiten erweiterten Agents durch Reinforcement Learning

Über die semantische Ähnlichkeit hinaus: Eine Neubewertung der retrieval-basierten Suche für agentic Search durch direkte Interaktion mit dem Korpus

MathNet: Ein globaler Multimodal-Benchmark für mathematisches Reasoning und Retrieval

D-OPSD: On-Policy Selbst-Distillation zur kontinuierlichen Feinabstimmung von step-distilled Diffusion Modellen

ZAYA1-8B Technischer Bericht

PhysForge: Generierung physikalisch fundierter 3D-Assets für interaktive virtuelle Welten

Ein einzelnes Neuron genügt, um die Sicherheitsausrichtung in großen Sprachmodellen zu umgehen

SlimQwen: Untersuchung der Pruning- und Distillationsmethoden in der Vorverarbeitung großer MoE-Modelle

ELF: Eingebettete Sprachflüsse

PaperFit: Optimierung der Satzstruktur wissenschaftlicher Dokumente durch visuelles Feedback

Rubrikbasierte On-Policy-Distillation

CollabVR: Kollaborative Videorationalität mit visuell-sprachlichen und videogenerativen Modellen

TMAS: Skalierung der Rechenleistung zur Testzeit durch Multi-Agent-Synergie

Soohak: Ein von Mathematikern kuratierter Benchmark zur Bewertung der mathematischen Fähigkeiten auf Forschungsstufe von LLMs

Technischer Bericht zu Qwen-Image-2.0

MiniCPM-o 4.5: Auf dem Weg zu einer Echtzeit-Voll-Duplex-Omni-Modal-Interaktion

Lernen während des Einsatzes: Fleet-Skalierbare Bestärkungslernen-Verfahren für allgemeine Roboterpolicies

Fast Byte Latent Transformer

KI-Mitmathematiker: Beschleunigung von Mathematikern durch agentic AI

HyperEyes: Dual-Grained Efficiency-Aware Reinforcement Learning für Parallele Multimodale Search Agents

Mean-Modus-Schreien: Mittelwert-Varianz-aufgeteilte Residuen für 1000-Schicht-Diffusions-Transformers

LLMs verbessern LLMs: Agentic Discovery für Test-Time Scaling

List-basierte Politikoptimierung: Gruppenbasierte RLVR als Zielprojektion auf das LLM-Antwort-Simplex

Flow-OPD: On-Policy-Distillation für Flow-Matching-Modelle

MACE-Dance: Bewegungs- und Erscheinungs-Kaskadierende Experten für musikgetriebene Tanzvideogenerierung

Erneutes Überdenken reasoning-intensiver Abrufmethoden: Bewertung und Verbesserung von Retrievers in agentic Search-Systemen

Wann ist der Phantasie zu vertrauen: Adaptive Handlungsexecution für World Action Models

RaguTeam bei SemEval-2026 Aufgabe 8: Meno und Freunde in einem von einem Richter orchestrierten LLM-Ensemble für glaubwürdige Mehrfachantwort-Generierung

MiA-Signatur: Annäherung an globale Aktivität zum Verständnis langer Kontexte

Continuous Latent Diffusion Language Model

Fähigkeit 1: Unified Evolution von mit Fähigkeiten erweiterten Agents durch Reinforcement Learning

Über die semantische Ähnlichkeit hinaus: Eine Neubewertung der retrieval-basierten Suche für agentic Search durch direkte Interaktion mit dem Korpus

MathNet: Ein globaler Multimodal-Benchmark für mathematisches Reasoning und Retrieval

D-OPSD: On-Policy Selbst-Distillation zur kontinuierlichen Feinabstimmung von step-distilled Diffusion Modellen

ZAYA1-8B Technischer Bericht

PhysForge: Generierung physikalisch fundierter 3D-Assets für interaktive virtuelle Welten