HyperAI

Hauptbereich

GPU

Konsole
Studio
Dokumente
Preise

Pulse

Neuigkeiten

Ressourcen

Fachartikel
Notebooks
Datensätze
Wiki

Benchmarks

SOTA
LLM-Modelle
GPU-Bestenliste

Community

Veranstaltungen

Tools

Über uns Nutzungsbedingungen Datenschutzerklärung
Deutsch

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Täglich aktualisierte hochmoderne KI-Forschungsarbeiten, um Sie über die neuesten KI-Trends auf dem Laufenden zu halten

Gestalten Sie die Zukunft der Künstlichen Intelligenz

Über uns

Über uns Support Hilfe zu Datensätzen

Produkte

Neuigkeiten Fachartikel Notebooks Datensätze Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Hauptbereich

GPU

Konsole
Studio
Dokumente
Preise

Pulse

Neuigkeiten

Ressourcen

Fachartikel
Notebooks
Datensätze
Wiki

Benchmarks

SOTA
LLM-Modelle
GPU-Bestenliste

Community

Veranstaltungen

Tools

Über uns Nutzungsbedingungen Datenschutzerklärung
Deutsch

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Täglich aktualisierte hochmoderne KI-Forschungsarbeiten, um Sie über die neuesten KI-Trends auf dem Laufenden zu halten

Gestalten Sie die Zukunft der Künstlichen Intelligenz

Über uns

Über uns Support Hilfe zu Datensätzen

Produkte

Neuigkeiten Fachartikel Notebooks Datensätze Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

Jenseits der Transkription: Mechanistische Interpretierbarkeit in der Spracherkennung

Jenseits der Transkription: Mechanistische Interpretierbarkeit in der Spracherkennung

Neta Glazer, Yael Segal-Feldman, Hilit Segev, et al.

CODA: Koordination von Großhirn und Kleinhirn für einen Dual-Brain-Computer-Nutzungs-Agenten mit entkoppelter Verstärkungslernung

CODA: Koordination von Großhirn und Kleinhirn für einen Dual-Brain-Computer-Nutzungs-Agenten mit entkoppelter Verstärkungslernung

Verstärkendes Lernen

Zeyi Sun, Yuhang Cao, Jianze Liang, et al.

WebSight: Eine vision-first-Architektur für robuste Web-Agenten

Tanvir Bhathal, Asanshay Gupta

UltraMemV2: Speicher-Netzwerke mit Skalierung auf 120B Parameter und überlegener Lernleistung für lange Kontexte

Zihao Huang, Yu Bao, Qiyang Min, et al.

Technischer Bericht von Hermes 4

Ryan Teknium, Roger Jin, Jai Suphavadeeprasit, et al.

OmniHuman-1.5: Verleihen eines aktiven Geistes an Avatare durch kognitive Simulation

Multimodale Darstellung

Jianwen Jiang, Weihong Zeng, Zerong Zheng, et al.

VoxHammer: trainingsfreie präzise und kohärente 3D-Editierung im nativen 3D-Raum

Diffusionsmodell

Lin Li, Zehuan Huang, Haoran Feng, et al.

CMPhysBench: Ein Benchmark zur Bewertung großer Sprachmodelle in der Festkörperphysik

Weida Wang, Dongchen Huang, Jiatong Li, et al.

TreePO: Brücke zwischen Policy-Optimierung und Wirksamkeit sowie Inferenzeffizienz durch heuristische baumbasierte Modellierung

Verstärkendes Lernen

Yizhi Li, Qingshui Gu, Zhoufutu Wen, et al.

Nemotron-CC-Math: Ein hochwertiger Vortrainingsdatensatz für Mathematik mit Skalierung auf 133 Milliarden Token

Rabeeh Karimi Mahabadi, Sanjeev Satheesh, Shrimai Prabhumoye, et al.

Verständniswerkzeug-integriertes Schließen

Heng Lin, Zhongwen Xu

Spacer: Hin zu künstlich gestalteter wissenschaftlicher Inspiration

Textgenerierung

Minhyeong Lee, Suyoung Hwang, Seunghyun Moon, et al.

Jenseits der Wiederholung: Verlängerung der Rekursionstiefe durch Rekurrenz, Gedächtnis und Skalierung der Rechenleistung zur Prüfungszeit

Ivan Rodkin, Daniil Orel, Konstantin Smirnov, et al.

VibeVoice Technischer Bericht

Zhiliang Peng, Jianwei Yu, Wenhui Wang, et al.

MMTok: Multimodale Abdeckungsoptimierung für eine effiziente Inferenz von VLMs

Multimodale Darstellung

Sixun Dong, Juhua Hu, Mian Zhang, et al.

MV-RAG: Retrievalgestützte multiview-Diffusionsmethode

Diffusionsmodell

Yosef Dayani, Omer Benishu, Sagie Benaim

Verbindung der Synthese von metallorganischen Gerüsten mit Anwendungen mittels multimodaler maschineller Lernverfahren

Sartaaj Takrim Khan, Seyed Mohamad Moosavi

Modellkontext-Protokolle in adaptiven Transportsystemen: Eine Übersicht

Gaurab Chhetri, Shriyank Somvanshi, Md Monzurul Islam, et al.

Algorithmenbasierte kollektive Aktion mit mehreren Kollektiven

Stimmungsklassifikation

Claudio Battiloro, Pietro Greiner, Bret Nestor, Oumaima Amezgar, Francesca Dominici

OpenCUA: Offene Grundlagen für Computer-Use-Agenten

Xinyuan Wang, Bowen Wang, Dunjie Lu, et al.

Raumpolitik: Steuerung visuomotorischer robotischer Manipulation mittels raumbewusster Modellierung und Schlussfolgerung

Körperliche Intelligenz

Yijun Liu, Yuwei Liu, Yuan Meng, et al.

Jet-Nemotron: Effizientes Sprachmodell mit nachgeschalteter neuronaler Architektursuche

Yuxian Gu, Qinghao Hu, Shang Yang, et al.

CRISP: Persistente Konzeptvergessen durch sparse Autoencoder

Tomer Ashuach, Dana Arad, Aaron Mueller, et al.

Selektives kontrastives Lernen für schwach überwachtes Affordance-Grundlegen

Computer Vision

WonJun Moon, Hyun Seok Seong, Jae-Pil Heo

EgoTwin: Träumender Körper und Perspektive aus erster Person

Jingqiao Xiu, Fangzhou Hong, Yicong Li, et al.

Jenseits von Pass@1: Selbstspiel mit variationaler Problemgenerierung erhält RLVR aufrechterhalten

Verstärkendes Lernen

Xiao Liang, Zhongzhi Li, Yeyun Gong, et al.

ODYSSEY: Offene Welt Erkundung und Manipulation von Viertelfüßlern für langfristige Aufgaben

Körperliche Intelligenz

Kaijun Wang, Liqin Lu, Mingyu Liu, et al.

AgentFly: Feinabstimmen von LLM-Agenten ohne Feinabstimmen von LLMs

Verstärkendes Lernen

Huichi Zhou, Yihang Chen, Siyuan Guo, et al.

Constraints-Guided Diffusion Reasoner für neuro-symbolisches Lernen

Xuan Zhang, Zhijian Zhou, Weidi Xu, et al.

LLM-basierte Agenten zur Erkundung des Wettbewerbslandschafts bei der Due-Diligence von Arzneimittelressourcen

Dokumentenverstehen

Alisa Vinogradova, Vlad Vinogradov, Dmitrii Radkevich, et al.

SceneGen: Einzelbild-3D-Szenenerzeugung in einem Feedforward-Schritt

Yanxu Meng, Haoning Wu, Ya Zhang, et al.

Eine Übersicht über Benchmark-Tests für große Sprachmodelle

Shiwen Ni, Guhong Chen, Shuaimin Li, et al.

Jenseits der Transkription: Mechanistische Interpretierbarkeit in der Spracherkennung

Jenseits der Transkription: Mechanistische Interpretierbarkeit in der Spracherkennung

Neta Glazer, Yael Segal-Feldman, Hilit Segev, et al.

CODA: Koordination von Großhirn und Kleinhirn für einen Dual-Brain-Computer-Nutzungs-Agenten mit entkoppelter Verstärkungslernung

CODA: Koordination von Großhirn und Kleinhirn für einen Dual-Brain-Computer-Nutzungs-Agenten mit entkoppelter Verstärkungslernung

Verstärkendes Lernen

Zeyi Sun, Yuhang Cao, Jianze Liang, et al.

WebSight: Eine vision-first-Architektur für robuste Web-Agenten

Tanvir Bhathal, Asanshay Gupta

UltraMemV2: Speicher-Netzwerke mit Skalierung auf 120B Parameter und überlegener Lernleistung für lange Kontexte

Zihao Huang, Yu Bao, Qiyang Min, et al.

Technischer Bericht von Hermes 4

Ryan Teknium, Roger Jin, Jai Suphavadeeprasit, et al.

OmniHuman-1.5: Verleihen eines aktiven Geistes an Avatare durch kognitive Simulation

Multimodale Darstellung

Jianwen Jiang, Weihong Zeng, Zerong Zheng, et al.

VoxHammer: trainingsfreie präzise und kohärente 3D-Editierung im nativen 3D-Raum

Diffusionsmodell

Lin Li, Zehuan Huang, Haoran Feng, et al.

CMPhysBench: Ein Benchmark zur Bewertung großer Sprachmodelle in der Festkörperphysik

Weida Wang, Dongchen Huang, Jiatong Li, et al.

TreePO: Brücke zwischen Policy-Optimierung und Wirksamkeit sowie Inferenzeffizienz durch heuristische baumbasierte Modellierung

Verstärkendes Lernen

Yizhi Li, Qingshui Gu, Zhoufutu Wen, et al.

Nemotron-CC-Math: Ein hochwertiger Vortrainingsdatensatz für Mathematik mit Skalierung auf 133 Milliarden Token

Rabeeh Karimi Mahabadi, Sanjeev Satheesh, Shrimai Prabhumoye, et al.

Verständniswerkzeug-integriertes Schließen

Heng Lin, Zhongwen Xu

Spacer: Hin zu künstlich gestalteter wissenschaftlicher Inspiration

Textgenerierung

Minhyeong Lee, Suyoung Hwang, Seunghyun Moon, et al.

Jenseits der Wiederholung: Verlängerung der Rekursionstiefe durch Rekurrenz, Gedächtnis und Skalierung der Rechenleistung zur Prüfungszeit

Ivan Rodkin, Daniil Orel, Konstantin Smirnov, et al.

VibeVoice Technischer Bericht

Zhiliang Peng, Jianwei Yu, Wenhui Wang, et al.

MMTok: Multimodale Abdeckungsoptimierung für eine effiziente Inferenz von VLMs

Multimodale Darstellung

Sixun Dong, Juhua Hu, Mian Zhang, et al.

MV-RAG: Retrievalgestützte multiview-Diffusionsmethode

Diffusionsmodell

Yosef Dayani, Omer Benishu, Sagie Benaim

Verbindung der Synthese von metallorganischen Gerüsten mit Anwendungen mittels multimodaler maschineller Lernverfahren

Sartaaj Takrim Khan, Seyed Mohamad Moosavi

Modellkontext-Protokolle in adaptiven Transportsystemen: Eine Übersicht

Gaurab Chhetri, Shriyank Somvanshi, Md Monzurul Islam, et al.

Algorithmenbasierte kollektive Aktion mit mehreren Kollektiven

Stimmungsklassifikation

Claudio Battiloro, Pietro Greiner, Bret Nestor, Oumaima Amezgar, Francesca Dominici

OpenCUA: Offene Grundlagen für Computer-Use-Agenten

Xinyuan Wang, Bowen Wang, Dunjie Lu, et al.

Raumpolitik: Steuerung visuomotorischer robotischer Manipulation mittels raumbewusster Modellierung und Schlussfolgerung

Körperliche Intelligenz

Yijun Liu, Yuwei Liu, Yuan Meng, et al.

Jet-Nemotron: Effizientes Sprachmodell mit nachgeschalteter neuronaler Architektursuche

Yuxian Gu, Qinghao Hu, Shang Yang, et al.

CRISP: Persistente Konzeptvergessen durch sparse Autoencoder

Tomer Ashuach, Dana Arad, Aaron Mueller, et al.

Selektives kontrastives Lernen für schwach überwachtes Affordance-Grundlegen

Computer Vision

WonJun Moon, Hyun Seok Seong, Jae-Pil Heo

EgoTwin: Träumender Körper und Perspektive aus erster Person

Jingqiao Xiu, Fangzhou Hong, Yicong Li, et al.

Jenseits von Pass@1: Selbstspiel mit variationaler Problemgenerierung erhält RLVR aufrechterhalten

Verstärkendes Lernen

Xiao Liang, Zhongzhi Li, Yeyun Gong, et al.

ODYSSEY: Offene Welt Erkundung und Manipulation von Viertelfüßlern für langfristige Aufgaben

Körperliche Intelligenz

Kaijun Wang, Liqin Lu, Mingyu Liu, et al.

AgentFly: Feinabstimmen von LLM-Agenten ohne Feinabstimmen von LLMs

Verstärkendes Lernen

Huichi Zhou, Yihang Chen, Siyuan Guo, et al.

Constraints-Guided Diffusion Reasoner für neuro-symbolisches Lernen

Xuan Zhang, Zhijian Zhou, Weidi Xu, et al.

LLM-basierte Agenten zur Erkundung des Wettbewerbslandschafts bei der Due-Diligence von Arzneimittelressourcen

Dokumentenverstehen

Alisa Vinogradova, Vlad Vinogradov, Dmitrii Radkevich, et al.

SceneGen: Einzelbild-3D-Szenenerzeugung in einem Feedforward-Schritt

Yanxu Meng, Haoning Wu, Ya Zhang, et al.

Eine Übersicht über Benchmark-Tests für große Sprachmodelle

Shiwen Ni, Guhong Chen, Shuaimin Li, et al.

WebSight: Eine vision-first-Architektur für robuste Web-Agenten

UltraMemV2: Speicher-Netzwerke mit Skalierung auf 120B Parameter und überlegener Lernleistung für lange Kontexte

Technischer Bericht von Hermes 4

OmniHuman-1.5: Verleihen eines aktiven Geistes an Avatare durch kognitive Simulation

VoxHammer: trainingsfreie präzise und kohärente 3D-Editierung im nativen 3D-Raum

CMPhysBench: Ein Benchmark zur Bewertung großer Sprachmodelle in der Festkörperphysik

TreePO: Brücke zwischen Policy-Optimierung und Wirksamkeit sowie Inferenzeffizienz durch heuristische baumbasierte Modellierung

Nemotron-CC-Math: Ein hochwertiger Vortrainingsdatensatz für Mathematik mit Skalierung auf 133 Milliarden Token

Verständniswerkzeug-integriertes Schließen

Spacer: Hin zu künstlich gestalteter wissenschaftlicher Inspiration

Jenseits der Wiederholung: Verlängerung der Rekursionstiefe durch Rekurrenz, Gedächtnis und Skalierung der Rechenleistung zur Prüfungszeit

VibeVoice Technischer Bericht

MMTok: Multimodale Abdeckungsoptimierung für eine effiziente Inferenz von VLMs

MV-RAG: Retrievalgestützte multiview-Diffusionsmethode

Verbindung der Synthese von metallorganischen Gerüsten mit Anwendungen mittels multimodaler maschineller Lernverfahren

Modellkontext-Protokolle in adaptiven Transportsystemen: Eine Übersicht

Algorithmenbasierte kollektive Aktion mit mehreren Kollektiven

OpenCUA: Offene Grundlagen für Computer-Use-Agenten

Raumpolitik: Steuerung visuomotorischer robotischer Manipulation mittels raumbewusster Modellierung und Schlussfolgerung

Jet-Nemotron: Effizientes Sprachmodell mit nachgeschalteter neuronaler Architektursuche

CRISP: Persistente Konzeptvergessen durch sparse Autoencoder

Selektives kontrastives Lernen für schwach überwachtes Affordance-Grundlegen

EgoTwin: Träumender Körper und Perspektive aus erster Person

Jenseits von Pass@1: Selbstspiel mit variationaler Problemgenerierung erhält RLVR aufrechterhalten

ODYSSEY: Offene Welt Erkundung und Manipulation von Viertelfüßlern für langfristige Aufgaben

AgentFly: Feinabstimmen von LLM-Agenten ohne Feinabstimmen von LLMs

Constraints-Guided Diffusion Reasoner für neuro-symbolisches Lernen

LLM-basierte Agenten zur Erkundung des Wettbewerbslandschafts bei der Due-Diligence von Arzneimittelressourcen

SceneGen: Einzelbild-3D-Szenenerzeugung in einem Feedforward-Schritt

Eine Übersicht über Benchmark-Tests für große Sprachmodelle

WebSight: Eine vision-first-Architektur für robuste Web-Agenten

UltraMemV2: Speicher-Netzwerke mit Skalierung auf 120B Parameter und überlegener Lernleistung für lange Kontexte

Technischer Bericht von Hermes 4

OmniHuman-1.5: Verleihen eines aktiven Geistes an Avatare durch kognitive Simulation

VoxHammer: trainingsfreie präzise und kohärente 3D-Editierung im nativen 3D-Raum

CMPhysBench: Ein Benchmark zur Bewertung großer Sprachmodelle in der Festkörperphysik

TreePO: Brücke zwischen Policy-Optimierung und Wirksamkeit sowie Inferenzeffizienz durch heuristische baumbasierte Modellierung

Nemotron-CC-Math: Ein hochwertiger Vortrainingsdatensatz für Mathematik mit Skalierung auf 133 Milliarden Token

Verständniswerkzeug-integriertes Schließen

Spacer: Hin zu künstlich gestalteter wissenschaftlicher Inspiration

Jenseits der Wiederholung: Verlängerung der Rekursionstiefe durch Rekurrenz, Gedächtnis und Skalierung der Rechenleistung zur Prüfungszeit

VibeVoice Technischer Bericht

MMTok: Multimodale Abdeckungsoptimierung für eine effiziente Inferenz von VLMs

MV-RAG: Retrievalgestützte multiview-Diffusionsmethode

Verbindung der Synthese von metallorganischen Gerüsten mit Anwendungen mittels multimodaler maschineller Lernverfahren

Modellkontext-Protokolle in adaptiven Transportsystemen: Eine Übersicht

Algorithmenbasierte kollektive Aktion mit mehreren Kollektiven

OpenCUA: Offene Grundlagen für Computer-Use-Agenten

Raumpolitik: Steuerung visuomotorischer robotischer Manipulation mittels raumbewusster Modellierung und Schlussfolgerung

Jet-Nemotron: Effizientes Sprachmodell mit nachgeschalteter neuronaler Architektursuche

CRISP: Persistente Konzeptvergessen durch sparse Autoencoder

Selektives kontrastives Lernen für schwach überwachtes Affordance-Grundlegen

EgoTwin: Träumender Körper und Perspektive aus erster Person

Jenseits von Pass@1: Selbstspiel mit variationaler Problemgenerierung erhält RLVR aufrechterhalten

ODYSSEY: Offene Welt Erkundung und Manipulation von Viertelfüßlern für langfristige Aufgaben

AgentFly: Feinabstimmen von LLM-Agenten ohne Feinabstimmen von LLMs

Constraints-Guided Diffusion Reasoner für neuro-symbolisches Lernen

LLM-basierte Agenten zur Erkundung des Wettbewerbslandschafts bei der Due-Diligence von Arzneimittelressourcen

SceneGen: Einzelbild-3D-Szenenerzeugung in einem Feedforward-Schritt

Eine Übersicht über Benchmark-Tests für große Sprachmodelle