HyperAI

Hauptbereich

GPU

Konsole
Studio
Dokumente
Preise

Pulse

Neuigkeiten

Ressourcen

Fachartikel
Notebooks
Datensätze
Wiki

Benchmarks

SOTA
LLM-Modelle
GPU-Bestenliste

Community

Veranstaltungen

Tools

Über uns Nutzungsbedingungen Datenschutzerklärung
Deutsch

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Täglich aktualisierte hochmoderne KI-Forschungsarbeiten, um Sie über die neuesten KI-Trends auf dem Laufenden zu halten

Gestalten Sie die Zukunft der Künstlichen Intelligenz

Über uns

Über uns Support Hilfe zu Datensätzen

Produkte

Neuigkeiten Fachartikel Notebooks Datensätze Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Hauptbereich

GPU

Konsole
Studio
Dokumente
Preise

Pulse

Neuigkeiten

Ressourcen

Fachartikel
Notebooks
Datensätze
Wiki

Benchmarks

SOTA
LLM-Modelle
GPU-Bestenliste

Community

Veranstaltungen

Tools

Über uns Nutzungsbedingungen Datenschutzerklärung
Deutsch

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Täglich aktualisierte hochmoderne KI-Forschungsarbeiten, um Sie über die neuesten KI-Trends auf dem Laufenden zu halten

Gestalten Sie die Zukunft der Künstlichen Intelligenz

Über uns

Über uns Support Hilfe zu Datensätzen

Produkte

Neuigkeiten Fachartikel Notebooks Datensätze Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

Deep Learning in der Fernerkundung: Ein Überblick

Deep Learning in der Fernerkundung: Ein Überblick

Xiao Xiang Zhu, Devis Tuia, Lichao Mou, et al.

Ein regressionsbasierter Ansatz zur Sprachverbesserung mittels tiefer neuronaler Netze

Ein regressionsbasierter Ansatz zur Sprachverbesserung mittels tiefer neuronaler Netze

Audio- Und Sprachverarbeitung

Yong Xu, Jun Du, Li-Rong Dai, et al.

Tiefe neuronale Netze für die akustische Modellierung in der Spracherkennung

Neuronale Netze

Audio- Und Sprachverarbeitung

Geoffrey Hinton, Li Deng, Dong Yu, et al.

RoboTTT: Kontextskalierung für Roboterrichtlinien

Verstärkendes Lernen

Yunfan Jiang, Yevgen Chebotar, Ruijie Zheng, et al.

SWE-agent: Agent-Computer-Schnittstellen ermöglichen automatisierte Softwareentwicklung

Codegenerierung

John Yang, Carlos E. Jimenez, Alexander Wettig, et al.

Effiziente Schätzung von Wortrepräsentationen im Vektorraum

Natürliche Sprachverarbeitung

Tomas Mikolov, Greg Corrado, Kai Chen, et al.

Tiefenkartenvorhersage aus einem Einzelbild mit einem mehrskaligen tiefen Netzwerk

Tiefenschätzung

Computer Vision

David Eigen, Christian Puhrsch, Rob Fergus

TabNet: Aufmerksames interpretierbares tabellarisches Lernen

Sercan O. Arık, Tomas Pfister

AudioPaLM: Ein großes Sprachmodell, das sprechen und zuhören kann

Paul K. Rubenstein, Chulayuth Asawaroengchai, Duc Dung Nguyen, et al.

SQuAD: Über 100.000 Fragen für maschinelles Textverständnis

Intelligente Fragebeantwortung

Natürliche Sprachverarbeitung

Pranav Rajpurkar, Jian Zhang, Konstantin Lopyrev, et al.

DeepPose: Schätzung menschlicher Körperhaltungen mittels tiefer neuronaler Netze

Computer Vision

Alexander Toshev, Christian Szegedy

Selbstverbesserungen in modernen agentischen Systemen: Ein Überblick

Zhe Ren, Yimeng Chen, Dandan Guo, et al.

Single-Rollout Asynchrone Optimierung für agentisches Reinforcement Learning

Verstärkendes Lernen

Zhenyu Hou, Yujiang Li, Jie Tang, et al.

SparDA: Sparse Decoupled Attention für effiziente Inferenz bei langen Kontexten in LLMs

Yaosheng Fu, Guangxuan Xiao, Xin Dong, et al.

MetaView: Monokulare Neuansichtssynthese mit maßstabsbewussten impliziten Geometrie-Priors

Diffusionsmodell

Yufei Cai, Xuesong Niu, Hao Lu, et al.

PolicyShiftGuard: Benchmarking und Verbesserung von policy-adaptiven Bildschutzmechanismen

Überwachtes Feinabstimmen

Mingyang Song, Luxin Xu, Haoyu Sun, et al.

KnowAct-GUIClaw: Tief verstehen, perfekt handeln – Persönlicher GUI-Assistent mit selbstentwickelndem Gedächtnis und Fertigkeiten

Yunxin Li, Jinchao Li, Baotian Hu, et al.

OvisOCR2 Technischer Bericht

Dokumentenverstehen

Shiyin Lu, Yinglun Li, Yu Xia, et al.

Boogu-Image-0.1: Förderung quelloffener, vereinheitlichter multimodaler Verständnisund Generierungsmodelle

Bildgenerierung

Rui Liu, Chao Huang, Han Shi, et al.

Harness Handbook: Entwicklung von Agenten-Harnesses lesbar, navigierbar und editierbar machen

Codegenerierung

Ruhan Wang, Yucheng Shi, Zongxia Li, et al.

Qwen-Music Technischer Bericht

Jin Xu, Shun Lei, Xueyao Zhang, et al.

Spektrale Neuverdrahtung für Exploration, Bereinigung und Modellfusion

Zhilong Zhang, Hongli Yu, Huan-ang Gao, et al.

Die Evaluation der Harness-Evolution für Agenten neu denken

Yike Wang, Huaisheng Zhu, Zhengyu Hu, et al.

Ring-Zero: Skalierung von Zero RL auf eine Billion Parameter für emergentes Reasoning

Verstärkendes Lernen

Xinyu Tang, Gangqiang Cao, Yurou Liu, et al.

Die Kluft zwischen latentem und explizitem Denken mit geloopten Transformern überbrücken

Ying Fan, Anej Svete, Kangwook Lee

Auf dem Weg zu autonomer und prüfbarer Entwicklung medizinischer Bildgebungsmodelle

Medizinische Bildgebung

Shengyuan Liu, Jia-Xuan Jiang, Boyun Zheng, et al.

MUSCRIPTOR: EIN OFFENES MODELL FÜR DIE TRANSKRIPTION VON MUSIK MIT MEHREREN INSTRUMENTEN

Spracherkennung

Audio- Und Sprachverarbeitung

Simon Rouard, Carl-Johann Simon-Gabriel, Michael Krause

Prinzipiengeleitete Analyse von Evaluationsund Designparadigmen des tiefen bestärkenden Lernens

Verstärkendes Lernen

Wissen vor der Lösung: QA-gesteuerte Wissensakquise aus Repositories für die Behebung von Softwareproblemen

Codegenerierung

Intelligente Fragebeantwortung

Haotian Lin, Silin Chen, Xiaodong Gu, et al.

Blind-Spots-Bench: Evaluierung blinder Flecken in multimodalen Modellen

Matteo Santelmo, Xiuying Wei, Israa Fakih, et al.

Read It Back: Vortrainierte MLLMs sind Zero-Shot-Belohnungsmodelle für die Text-zu-Bild-Generierung

Diffusionsmodell

Runhui Huang, Qihui Zhang, Zhe Liu, et al.

Die Rolle der Strenge in der Künstlichen Intelligenz

Künstliche Intelligenz

Deep Learning in der Fernerkundung: Ein Überblick

Deep Learning in der Fernerkundung: Ein Überblick

Xiao Xiang Zhu, Devis Tuia, Lichao Mou, et al.

Ein regressionsbasierter Ansatz zur Sprachverbesserung mittels tiefer neuronaler Netze

Ein regressionsbasierter Ansatz zur Sprachverbesserung mittels tiefer neuronaler Netze

Audio- Und Sprachverarbeitung

Yong Xu, Jun Du, Li-Rong Dai, et al.

Tiefe neuronale Netze für die akustische Modellierung in der Spracherkennung

Neuronale Netze

Audio- Und Sprachverarbeitung

Geoffrey Hinton, Li Deng, Dong Yu, et al.

RoboTTT: Kontextskalierung für Roboterrichtlinien

Verstärkendes Lernen

Yunfan Jiang, Yevgen Chebotar, Ruijie Zheng, et al.

SWE-agent: Agent-Computer-Schnittstellen ermöglichen automatisierte Softwareentwicklung

Codegenerierung

John Yang, Carlos E. Jimenez, Alexander Wettig, et al.

Effiziente Schätzung von Wortrepräsentationen im Vektorraum

Natürliche Sprachverarbeitung

Tomas Mikolov, Greg Corrado, Kai Chen, et al.

Tiefenkartenvorhersage aus einem Einzelbild mit einem mehrskaligen tiefen Netzwerk

Tiefenschätzung

Computer Vision

David Eigen, Christian Puhrsch, Rob Fergus

TabNet: Aufmerksames interpretierbares tabellarisches Lernen

Sercan O. Arık, Tomas Pfister

AudioPaLM: Ein großes Sprachmodell, das sprechen und zuhören kann

Paul K. Rubenstein, Chulayuth Asawaroengchai, Duc Dung Nguyen, et al.

SQuAD: Über 100.000 Fragen für maschinelles Textverständnis

Intelligente Fragebeantwortung

Natürliche Sprachverarbeitung

Pranav Rajpurkar, Jian Zhang, Konstantin Lopyrev, et al.

DeepPose: Schätzung menschlicher Körperhaltungen mittels tiefer neuronaler Netze

Computer Vision

Alexander Toshev, Christian Szegedy

Selbstverbesserungen in modernen agentischen Systemen: Ein Überblick

Zhe Ren, Yimeng Chen, Dandan Guo, et al.

Single-Rollout Asynchrone Optimierung für agentisches Reinforcement Learning

Verstärkendes Lernen

Zhenyu Hou, Yujiang Li, Jie Tang, et al.

SparDA: Sparse Decoupled Attention für effiziente Inferenz bei langen Kontexten in LLMs

Yaosheng Fu, Guangxuan Xiao, Xin Dong, et al.

MetaView: Monokulare Neuansichtssynthese mit maßstabsbewussten impliziten Geometrie-Priors

Diffusionsmodell

Yufei Cai, Xuesong Niu, Hao Lu, et al.

PolicyShiftGuard: Benchmarking und Verbesserung von policy-adaptiven Bildschutzmechanismen

Überwachtes Feinabstimmen

Mingyang Song, Luxin Xu, Haoyu Sun, et al.

KnowAct-GUIClaw: Tief verstehen, perfekt handeln – Persönlicher GUI-Assistent mit selbstentwickelndem Gedächtnis und Fertigkeiten

Yunxin Li, Jinchao Li, Baotian Hu, et al.

OvisOCR2 Technischer Bericht

Dokumentenverstehen

Shiyin Lu, Yinglun Li, Yu Xia, et al.

Boogu-Image-0.1: Förderung quelloffener, vereinheitlichter multimodaler Verständnisund Generierungsmodelle

Bildgenerierung

Rui Liu, Chao Huang, Han Shi, et al.

Harness Handbook: Entwicklung von Agenten-Harnesses lesbar, navigierbar und editierbar machen

Codegenerierung

Ruhan Wang, Yucheng Shi, Zongxia Li, et al.

Qwen-Music Technischer Bericht

Jin Xu, Shun Lei, Xueyao Zhang, et al.

Spektrale Neuverdrahtung für Exploration, Bereinigung und Modellfusion

Zhilong Zhang, Hongli Yu, Huan-ang Gao, et al.

Die Evaluation der Harness-Evolution für Agenten neu denken

Yike Wang, Huaisheng Zhu, Zhengyu Hu, et al.

Ring-Zero: Skalierung von Zero RL auf eine Billion Parameter für emergentes Reasoning

Verstärkendes Lernen

Xinyu Tang, Gangqiang Cao, Yurou Liu, et al.

Die Kluft zwischen latentem und explizitem Denken mit geloopten Transformern überbrücken

Ying Fan, Anej Svete, Kangwook Lee

Auf dem Weg zu autonomer und prüfbarer Entwicklung medizinischer Bildgebungsmodelle

Medizinische Bildgebung

Shengyuan Liu, Jia-Xuan Jiang, Boyun Zheng, et al.

MUSCRIPTOR: EIN OFFENES MODELL FÜR DIE TRANSKRIPTION VON MUSIK MIT MEHREREN INSTRUMENTEN

Spracherkennung

Audio- Und Sprachverarbeitung

Simon Rouard, Carl-Johann Simon-Gabriel, Michael Krause

Prinzipiengeleitete Analyse von Evaluationsund Designparadigmen des tiefen bestärkenden Lernens

Verstärkendes Lernen

Wissen vor der Lösung: QA-gesteuerte Wissensakquise aus Repositories für die Behebung von Softwareproblemen

Codegenerierung

Intelligente Fragebeantwortung

Haotian Lin, Silin Chen, Xiaodong Gu, et al.

Blind-Spots-Bench: Evaluierung blinder Flecken in multimodalen Modellen

Matteo Santelmo, Xiuying Wei, Israa Fakih, et al.

Read It Back: Vortrainierte MLLMs sind Zero-Shot-Belohnungsmodelle für die Text-zu-Bild-Generierung

Diffusionsmodell

Runhui Huang, Qihui Zhang, Zhe Liu, et al.

Die Rolle der Strenge in der Künstlichen Intelligenz

Künstliche Intelligenz

Tiefe neuronale Netze für die akustische Modellierung in der Spracherkennung

RoboTTT: Kontextskalierung für Roboterrichtlinien

SWE-agent: Agent-Computer-Schnittstellen ermöglichen automatisierte Softwareentwicklung

Effiziente Schätzung von Wortrepräsentationen im Vektorraum

Tiefenkartenvorhersage aus einem Einzelbild mit einem mehrskaligen tiefen Netzwerk

TabNet: Aufmerksames interpretierbares tabellarisches Lernen

AudioPaLM: Ein großes Sprachmodell, das sprechen und zuhören kann

SQuAD: Über 100.000 Fragen für maschinelles Textverständnis

DeepPose: Schätzung menschlicher Körperhaltungen mittels tiefer neuronaler Netze

Selbstverbesserungen in modernen agentischen Systemen: Ein Überblick

Single-Rollout Asynchrone Optimierung für agentisches Reinforcement Learning

SparDA: Sparse Decoupled Attention für effiziente Inferenz bei langen Kontexten in LLMs

MetaView: Monokulare Neuansichtssynthese mit maßstabsbewussten impliziten Geometrie-Priors

PolicyShiftGuard: Benchmarking und Verbesserung von policy-adaptiven Bildschutzmechanismen

KnowAct-GUIClaw: Tief verstehen, perfekt handeln – Persönlicher GUI-Assistent mit selbstentwickelndem Gedächtnis und Fertigkeiten

OvisOCR2 Technischer Bericht

Boogu-Image-0.1: Förderung quelloffener, vereinheitlichter multimodaler Verständnisund Generierungsmodelle

Harness Handbook: Entwicklung von Agenten-Harnesses lesbar, navigierbar und editierbar machen

Qwen-Music Technischer Bericht

Spektrale Neuverdrahtung für Exploration, Bereinigung und Modellfusion

Die Evaluation der Harness-Evolution für Agenten neu denken

Ring-Zero: Skalierung von Zero RL auf eine Billion Parameter für emergentes Reasoning

Die Kluft zwischen latentem und explizitem Denken mit geloopten Transformern überbrücken

Auf dem Weg zu autonomer und prüfbarer Entwicklung medizinischer Bildgebungsmodelle

MUSCRIPTOR: EIN OFFENES MODELL FÜR DIE TRANSKRIPTION VON MUSIK MIT MEHREREN INSTRUMENTEN

Prinzipiengeleitete Analyse von Evaluationsund Designparadigmen des tiefen bestärkenden Lernens

Wissen vor der Lösung: QA-gesteuerte Wissensakquise aus Repositories für die Behebung von Softwareproblemen

Blind-Spots-Bench: Evaluierung blinder Flecken in multimodalen Modellen

Read It Back: Vortrainierte MLLMs sind Zero-Shot-Belohnungsmodelle für die Text-zu-Bild-Generierung

Die Rolle der Strenge in der Künstlichen Intelligenz

Tiefe neuronale Netze für die akustische Modellierung in der Spracherkennung

RoboTTT: Kontextskalierung für Roboterrichtlinien

SWE-agent: Agent-Computer-Schnittstellen ermöglichen automatisierte Softwareentwicklung

Effiziente Schätzung von Wortrepräsentationen im Vektorraum

Tiefenkartenvorhersage aus einem Einzelbild mit einem mehrskaligen tiefen Netzwerk

TabNet: Aufmerksames interpretierbares tabellarisches Lernen

AudioPaLM: Ein großes Sprachmodell, das sprechen und zuhören kann

SQuAD: Über 100.000 Fragen für maschinelles Textverständnis

DeepPose: Schätzung menschlicher Körperhaltungen mittels tiefer neuronaler Netze

Selbstverbesserungen in modernen agentischen Systemen: Ein Überblick

Single-Rollout Asynchrone Optimierung für agentisches Reinforcement Learning

SparDA: Sparse Decoupled Attention für effiziente Inferenz bei langen Kontexten in LLMs

MetaView: Monokulare Neuansichtssynthese mit maßstabsbewussten impliziten Geometrie-Priors

PolicyShiftGuard: Benchmarking und Verbesserung von policy-adaptiven Bildschutzmechanismen

KnowAct-GUIClaw: Tief verstehen, perfekt handeln – Persönlicher GUI-Assistent mit selbstentwickelndem Gedächtnis und Fertigkeiten

OvisOCR2 Technischer Bericht

Boogu-Image-0.1: Förderung quelloffener, vereinheitlichter multimodaler Verständnisund Generierungsmodelle

Harness Handbook: Entwicklung von Agenten-Harnesses lesbar, navigierbar und editierbar machen

Qwen-Music Technischer Bericht

Spektrale Neuverdrahtung für Exploration, Bereinigung und Modellfusion

Die Evaluation der Harness-Evolution für Agenten neu denken

Ring-Zero: Skalierung von Zero RL auf eine Billion Parameter für emergentes Reasoning

Die Kluft zwischen latentem und explizitem Denken mit geloopten Transformern überbrücken

Auf dem Weg zu autonomer und prüfbarer Entwicklung medizinischer Bildgebungsmodelle

MUSCRIPTOR: EIN OFFENES MODELL FÜR DIE TRANSKRIPTION VON MUSIK MIT MEHREREN INSTRUMENTEN

Prinzipiengeleitete Analyse von Evaluationsund Designparadigmen des tiefen bestärkenden Lernens

Wissen vor der Lösung: QA-gesteuerte Wissensakquise aus Repositories für die Behebung von Softwareproblemen

Blind-Spots-Bench: Evaluierung blinder Flecken in multimodalen Modellen

Read It Back: Vortrainierte MLLMs sind Zero-Shot-Belohnungsmodelle für die Text-zu-Bild-Generierung

Die Rolle der Strenge in der Künstlichen Intelligenz