HyperAI

Hauptbereich

GPU

Konsole
Studio
Dokumente
Preise

Pulse

Neuigkeiten

Ressourcen

Fachartikel
Notebooks
Datensätze
Wiki

Benchmarks

SOTA
LLM-Modelle
GPU-Bestenliste

Community

Veranstaltungen

Tools

Über uns Nutzungsbedingungen Datenschutzerklärung
Deutsch

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Täglich aktualisierte hochmoderne KI-Forschungsarbeiten, um Sie über die neuesten KI-Trends auf dem Laufenden zu halten

Gestalten Sie die Zukunft der Künstlichen Intelligenz

Über uns

Über uns Support Hilfe zu Datensätzen

Produkte

Neuigkeiten Fachartikel Notebooks Datensätze Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Hauptbereich

GPU

Konsole
Studio
Dokumente
Preise

Pulse

Neuigkeiten

Ressourcen

Fachartikel
Notebooks
Datensätze
Wiki

Benchmarks

SOTA
LLM-Modelle
GPU-Bestenliste

Community

Veranstaltungen

Tools

Über uns Nutzungsbedingungen Datenschutzerklärung
Deutsch

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Täglich aktualisierte hochmoderne KI-Forschungsarbeiten, um Sie über die neuesten KI-Trends auf dem Laufenden zu halten

Gestalten Sie die Zukunft der Künstlichen Intelligenz

Über uns

Über uns Support Hilfe zu Datensätzen

Produkte

Neuigkeiten Fachartikel Notebooks Datensätze Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

Von Pixeln zu Wörtern – Hin zu nativen visuellen Sprachprimitiven in Skalierung

Von Pixeln zu Wörtern – Hin zu nativen visuellen Sprachprimitiven in Skalierung

Multimodale Darstellung

Haiwen Diao, Mingxuan Li, Silei Wu, et al.

Künstliche Intelligenz für Dienstleistungen: Proaktive Unterstützung mit KI-Brillen

Künstliche Intelligenz für Dienstleistungen: Proaktive Unterstützung mit KI-Brillen

Zichen Wen, Yiyu Wang, Chenfei Liao, et al.

WithAnyone: Hin zu kontrollierbarer und ID-konsistenter Bildgenerierung

Bildgenerierung

Hengyuan Xu, Wei Cheng, Peng Xing, et al.

Agenter Entropie-geglichener Politik-Optimierungsansatz

Verstärkendes Lernen

Guanting Dong, Licheng Bao, Zhongyuan Wang, et al.

Wenn Modelle Lügen, lernen wir: Multisprachige Erkennung von Halluzinationen auf Satzebene mit PsiloQA

Elisei Rykov, Kseniia Petrushina, Maksim Savkin, et al.

Vorhersage der sequenzspezifischen Amplifikationseffizienz bei Multi-Template-PCR mit Deep Learning

Faltungsneuronales Netzwerk

Andreas L. Gimpel, Bowen Fan, Dexiong Chen, et al.

Das Genome Analysis Toolkit: Ein MapReduce-Framework zur Analyse von Next-Generation-DNA-Sequenzierungsdaten

Hochleistungsrechnen

Aaron McKenna, Matthew Hanna, Eric Banks, et al.

LAMMPS – ein flexibles Simulationswerkzeug für die partikelbasierte Modellierung von Materialien auf atomarer, mesoskopischer und kontinuumsbasiertem Maßstab

Hochleistungsrechnen

Aidan P. Thompson, H. Metin Aktulga, Richard Berger, et al.

LabOS: Der KI-XR-Mitforscher, der Menschen sieht und mit ihnen zusammenarbeitet

Le Cong, Zaixi Zhang, Xiaotong Wang, et al.

Dolphin: Dokumentenbildanalyse durch heterogene Anchor-Prompting

Dokumentenverstehen

Hao Feng, Shu Wei, Xiang Fei, et al.

DeepMMSearch-R1: Multimodale LLMs in der multimodalen Web-Suche stärken

Visuelle Fragebeantwortung

Retrieval-Augmented Generation

Kartik Narayan, Yang Xu, Tian Cao, et al.

Skalierung großer Sprachmodelle für die nächste Generation der Einzelzellanalyse

KI Für Die Wissenschaft

Syed Asad Rizvi, Daniel Levine, Aakash Patel, et al.

Eine Übersicht über Vibe-Coding mit großen Sprachmodellen

Yuyao Ge, Lingrui Mei, Zenghao Duan, et al.

Erkennen Sie alles über die Vorhersage des nächsten Punkts

Objekterkennung

Qing Jiang, Junan Huo, Xingyu Chen, et al.

Skalierung der sprachzentrierten omnimodalen Repräsentationslernen

Multimodale Darstellung

Chenghao Xiao, Hou Pong Chan, Hao Zhang, et al.

DITING: Ein Multi-Agenten-Evaluierungsframework zur Benchmarking-Übersetzung von Web-Romanen

Enze Zhang, Jiaying Wang, Mengxi Xiao, et al.

Voranschritt bei der end-to-end Pixelraum-generativen Modellierung durch selbstüberwachtes Vortrainieren

Diffusionsmodell

Bildgenerierung

Jiachen Lei, Keli Liu, Julius Berner, et al.

Räumliche Beeinflussung: Implizite Ausrichtung räumlicher Repräsentationen für visuelle-Sprache-Aktions-Modelle

Multimodale Darstellung

Fuhao Li, Wenxuan Song, Han Zhao, et al.

Stellen von Klärungsfragen zur Präferenzerhebung mit großen Sprachmodellen

Präferenzmodellierung

Ali Montazeralghaem, Guy Tennenholtz, Craig Boutilier, et al.

CTRL-Rec: Empfehlungssysteme mit natürlicher Sprache steuern

Präferenzmodellierung

Natürliche Sprachverarbeitung

Micah Carroll, Adeline Foote, Kevin Feng, et al.

RLFR: Verlängerung des Verstärkungslernens für Sprachmodelle mit Flussumgebung

Verstärkendes Lernen

Jinghao Zhang, Naishan Zheng, Ruilin Li, et al.

Latente Verbesserungsdekodierung: Verbesserung diffusionbasierter Sprachmodelle durch die Verfeinerung von Glaubenszuständen

Diffusionsmodell

Textgenerierung

Qinglin Zhu, Yizhen Yao, Runcong Zhao, et al.

OmniVideoBench: Eine Bewertung der audiovisuellen Verständnisfähigkeit für Omni-MLLMs

Caorui Li, Yu Chen, Yiyan Ji, et al.

BEAR: Benchmarking und Verbesserung multimodaler Sprachmodelle für atomare verkörperte Fähigkeiten

Yu Qi, Haibo Zhao, Ziyu Guo, et al.

Diffusions-Transformers mit Repräsentations-Autoencoder

Diffusionsmodell

Bildgenerierung

Boyang Zheng, Nanye Ma, Shengbang Tong, et al.

QeRL: Über Effizienz hinaus – Quantisierungsverstärktes Verstärkungslernen für LLMs

Verstärkendes Lernen

Wei Huang, Yi Ge, Shuai Yang, et al.

Inversenfreie Wilson-Schleifen für Transformer: Ein praktischer Diagnoseansatz für Invarianz und Ordnungsempfindlichkeit

Überwachtes Feinabstimmen

Edward Y. Chang, Ethan Y. Chang

TUMIX: Multi-Agent Test-Time Scaling mit Werkzeugnutzungsmischung

Yongchao Chen, Jiefeng Chen, Rui Meng, et al.

R-Horizont: Wie weit kann Ihr großes Schlussfolgerungsmodell wirklich in Breite und Tiefe gehen?

Yi Lu, Jianing Wang, Linsen Guo, et al.

AutoPR: Lassen Sie Ihre akademische Beförderung automatisieren!

Qiguang Chen, Zheng Yan, Mingda Yang, et al.

Multimodale Prompt-Optimierung: Warum mehrere Modalitäten nicht für MLLMs genutzt werden sollten

Yumin Choi, Dongki Kim, Jinheon Baek, et al.

TAG: Tangential Amplifying Guidance für hallucinationsresistente Diffusions-Sampling

Diffusionsmodell

Bildgenerierung

Hyunmin Cho, Donghoon Ahn, Susung Hong, et al.

Von Pixeln zu Wörtern – Hin zu nativen visuellen Sprachprimitiven in Skalierung

Von Pixeln zu Wörtern – Hin zu nativen visuellen Sprachprimitiven in Skalierung

Multimodale Darstellung

Haiwen Diao, Mingxuan Li, Silei Wu, et al.

Künstliche Intelligenz für Dienstleistungen: Proaktive Unterstützung mit KI-Brillen

Künstliche Intelligenz für Dienstleistungen: Proaktive Unterstützung mit KI-Brillen

Zichen Wen, Yiyu Wang, Chenfei Liao, et al.

WithAnyone: Hin zu kontrollierbarer und ID-konsistenter Bildgenerierung

Bildgenerierung

Hengyuan Xu, Wei Cheng, Peng Xing, et al.

Agenter Entropie-geglichener Politik-Optimierungsansatz

Verstärkendes Lernen

Guanting Dong, Licheng Bao, Zhongyuan Wang, et al.

Wenn Modelle Lügen, lernen wir: Multisprachige Erkennung von Halluzinationen auf Satzebene mit PsiloQA

Elisei Rykov, Kseniia Petrushina, Maksim Savkin, et al.

Vorhersage der sequenzspezifischen Amplifikationseffizienz bei Multi-Template-PCR mit Deep Learning

Faltungsneuronales Netzwerk

Andreas L. Gimpel, Bowen Fan, Dexiong Chen, et al.

Das Genome Analysis Toolkit: Ein MapReduce-Framework zur Analyse von Next-Generation-DNA-Sequenzierungsdaten

Hochleistungsrechnen

Aaron McKenna, Matthew Hanna, Eric Banks, et al.

LAMMPS – ein flexibles Simulationswerkzeug für die partikelbasierte Modellierung von Materialien auf atomarer, mesoskopischer und kontinuumsbasiertem Maßstab

Hochleistungsrechnen

Aidan P. Thompson, H. Metin Aktulga, Richard Berger, et al.

LabOS: Der KI-XR-Mitforscher, der Menschen sieht und mit ihnen zusammenarbeitet

Le Cong, Zaixi Zhang, Xiaotong Wang, et al.

Dolphin: Dokumentenbildanalyse durch heterogene Anchor-Prompting

Dokumentenverstehen

Hao Feng, Shu Wei, Xiang Fei, et al.

DeepMMSearch-R1: Multimodale LLMs in der multimodalen Web-Suche stärken

Visuelle Fragebeantwortung

Retrieval-Augmented Generation

Kartik Narayan, Yang Xu, Tian Cao, et al.

Skalierung großer Sprachmodelle für die nächste Generation der Einzelzellanalyse

KI Für Die Wissenschaft

Syed Asad Rizvi, Daniel Levine, Aakash Patel, et al.

Eine Übersicht über Vibe-Coding mit großen Sprachmodellen

Yuyao Ge, Lingrui Mei, Zenghao Duan, et al.

Erkennen Sie alles über die Vorhersage des nächsten Punkts

Objekterkennung

Qing Jiang, Junan Huo, Xingyu Chen, et al.

Skalierung der sprachzentrierten omnimodalen Repräsentationslernen

Multimodale Darstellung

Chenghao Xiao, Hou Pong Chan, Hao Zhang, et al.

DITING: Ein Multi-Agenten-Evaluierungsframework zur Benchmarking-Übersetzung von Web-Romanen

Enze Zhang, Jiaying Wang, Mengxi Xiao, et al.

Voranschritt bei der end-to-end Pixelraum-generativen Modellierung durch selbstüberwachtes Vortrainieren

Diffusionsmodell

Bildgenerierung

Jiachen Lei, Keli Liu, Julius Berner, et al.

Räumliche Beeinflussung: Implizite Ausrichtung räumlicher Repräsentationen für visuelle-Sprache-Aktions-Modelle

Multimodale Darstellung

Fuhao Li, Wenxuan Song, Han Zhao, et al.

Stellen von Klärungsfragen zur Präferenzerhebung mit großen Sprachmodellen

Präferenzmodellierung

Ali Montazeralghaem, Guy Tennenholtz, Craig Boutilier, et al.

CTRL-Rec: Empfehlungssysteme mit natürlicher Sprache steuern

Präferenzmodellierung

Natürliche Sprachverarbeitung

Micah Carroll, Adeline Foote, Kevin Feng, et al.

RLFR: Verlängerung des Verstärkungslernens für Sprachmodelle mit Flussumgebung

Verstärkendes Lernen

Jinghao Zhang, Naishan Zheng, Ruilin Li, et al.

Latente Verbesserungsdekodierung: Verbesserung diffusionbasierter Sprachmodelle durch die Verfeinerung von Glaubenszuständen

Diffusionsmodell

Textgenerierung

Qinglin Zhu, Yizhen Yao, Runcong Zhao, et al.

OmniVideoBench: Eine Bewertung der audiovisuellen Verständnisfähigkeit für Omni-MLLMs

Caorui Li, Yu Chen, Yiyan Ji, et al.

BEAR: Benchmarking und Verbesserung multimodaler Sprachmodelle für atomare verkörperte Fähigkeiten

Yu Qi, Haibo Zhao, Ziyu Guo, et al.

Diffusions-Transformers mit Repräsentations-Autoencoder

Diffusionsmodell

Bildgenerierung

Boyang Zheng, Nanye Ma, Shengbang Tong, et al.

QeRL: Über Effizienz hinaus – Quantisierungsverstärktes Verstärkungslernen für LLMs

Verstärkendes Lernen

Wei Huang, Yi Ge, Shuai Yang, et al.

Inversenfreie Wilson-Schleifen für Transformer: Ein praktischer Diagnoseansatz für Invarianz und Ordnungsempfindlichkeit

Überwachtes Feinabstimmen

Edward Y. Chang, Ethan Y. Chang

TUMIX: Multi-Agent Test-Time Scaling mit Werkzeugnutzungsmischung

Yongchao Chen, Jiefeng Chen, Rui Meng, et al.

R-Horizont: Wie weit kann Ihr großes Schlussfolgerungsmodell wirklich in Breite und Tiefe gehen?

Yi Lu, Jianing Wang, Linsen Guo, et al.

AutoPR: Lassen Sie Ihre akademische Beförderung automatisieren!

Qiguang Chen, Zheng Yan, Mingda Yang, et al.

Multimodale Prompt-Optimierung: Warum mehrere Modalitäten nicht für MLLMs genutzt werden sollten

Yumin Choi, Dongki Kim, Jinheon Baek, et al.

TAG: Tangential Amplifying Guidance für hallucinationsresistente Diffusions-Sampling

Diffusionsmodell

Bildgenerierung

Hyunmin Cho, Donghoon Ahn, Susung Hong, et al.

WithAnyone: Hin zu kontrollierbarer und ID-konsistenter Bildgenerierung

Agenter Entropie-geglichener Politik-Optimierungsansatz

Wenn Modelle Lügen, lernen wir: Multisprachige Erkennung von Halluzinationen auf Satzebene mit PsiloQA

Vorhersage der sequenzspezifischen Amplifikationseffizienz bei Multi-Template-PCR mit Deep Learning

Das Genome Analysis Toolkit: Ein MapReduce-Framework zur Analyse von Next-Generation-DNA-Sequenzierungsdaten

LAMMPS – ein flexibles Simulationswerkzeug für die partikelbasierte Modellierung von Materialien auf atomarer, mesoskopischer und kontinuumsbasiertem Maßstab

LabOS: Der KI-XR-Mitforscher, der Menschen sieht und mit ihnen zusammenarbeitet

Dolphin: Dokumentenbildanalyse durch heterogene Anchor-Prompting

DeepMMSearch-R1: Multimodale LLMs in der multimodalen Web-Suche stärken

Skalierung großer Sprachmodelle für die nächste Generation der Einzelzellanalyse

Eine Übersicht über Vibe-Coding mit großen Sprachmodellen

Erkennen Sie alles über die Vorhersage des nächsten Punkts

Skalierung der sprachzentrierten omnimodalen Repräsentationslernen

DITING: Ein Multi-Agenten-Evaluierungsframework zur Benchmarking-Übersetzung von Web-Romanen

Voranschritt bei der end-to-end Pixelraum-generativen Modellierung durch selbstüberwachtes Vortrainieren

Räumliche Beeinflussung: Implizite Ausrichtung räumlicher Repräsentationen für visuelle-Sprache-Aktions-Modelle

Stellen von Klärungsfragen zur Präferenzerhebung mit großen Sprachmodellen

CTRL-Rec: Empfehlungssysteme mit natürlicher Sprache steuern

RLFR: Verlängerung des Verstärkungslernens für Sprachmodelle mit Flussumgebung

Latente Verbesserungsdekodierung: Verbesserung diffusionbasierter Sprachmodelle durch die Verfeinerung von Glaubenszuständen

OmniVideoBench: Eine Bewertung der audiovisuellen Verständnisfähigkeit für Omni-MLLMs

BEAR: Benchmarking und Verbesserung multimodaler Sprachmodelle für atomare verkörperte Fähigkeiten

Diffusions-Transformers mit Repräsentations-Autoencoder

QeRL: Über Effizienz hinaus – Quantisierungsverstärktes Verstärkungslernen für LLMs

Inversenfreie Wilson-Schleifen für Transformer: Ein praktischer Diagnoseansatz für Invarianz und Ordnungsempfindlichkeit

TUMIX: Multi-Agent Test-Time Scaling mit Werkzeugnutzungsmischung

R-Horizont: Wie weit kann Ihr großes Schlussfolgerungsmodell wirklich in Breite und Tiefe gehen?

AutoPR: Lassen Sie Ihre akademische Beförderung automatisieren!

Multimodale Prompt-Optimierung: Warum mehrere Modalitäten nicht für MLLMs genutzt werden sollten

TAG: Tangential Amplifying Guidance für hallucinationsresistente Diffusions-Sampling

WithAnyone: Hin zu kontrollierbarer und ID-konsistenter Bildgenerierung

Agenter Entropie-geglichener Politik-Optimierungsansatz

Wenn Modelle Lügen, lernen wir: Multisprachige Erkennung von Halluzinationen auf Satzebene mit PsiloQA

Vorhersage der sequenzspezifischen Amplifikationseffizienz bei Multi-Template-PCR mit Deep Learning

Das Genome Analysis Toolkit: Ein MapReduce-Framework zur Analyse von Next-Generation-DNA-Sequenzierungsdaten

LAMMPS – ein flexibles Simulationswerkzeug für die partikelbasierte Modellierung von Materialien auf atomarer, mesoskopischer und kontinuumsbasiertem Maßstab

LabOS: Der KI-XR-Mitforscher, der Menschen sieht und mit ihnen zusammenarbeitet

Dolphin: Dokumentenbildanalyse durch heterogene Anchor-Prompting

DeepMMSearch-R1: Multimodale LLMs in der multimodalen Web-Suche stärken

Skalierung großer Sprachmodelle für die nächste Generation der Einzelzellanalyse

Eine Übersicht über Vibe-Coding mit großen Sprachmodellen

Erkennen Sie alles über die Vorhersage des nächsten Punkts

Skalierung der sprachzentrierten omnimodalen Repräsentationslernen

DITING: Ein Multi-Agenten-Evaluierungsframework zur Benchmarking-Übersetzung von Web-Romanen

Voranschritt bei der end-to-end Pixelraum-generativen Modellierung durch selbstüberwachtes Vortrainieren

Räumliche Beeinflussung: Implizite Ausrichtung räumlicher Repräsentationen für visuelle-Sprache-Aktions-Modelle

Stellen von Klärungsfragen zur Präferenzerhebung mit großen Sprachmodellen

CTRL-Rec: Empfehlungssysteme mit natürlicher Sprache steuern

RLFR: Verlängerung des Verstärkungslernens für Sprachmodelle mit Flussumgebung

Latente Verbesserungsdekodierung: Verbesserung diffusionbasierter Sprachmodelle durch die Verfeinerung von Glaubenszuständen

OmniVideoBench: Eine Bewertung der audiovisuellen Verständnisfähigkeit für Omni-MLLMs

BEAR: Benchmarking und Verbesserung multimodaler Sprachmodelle für atomare verkörperte Fähigkeiten

Diffusions-Transformers mit Repräsentations-Autoencoder

QeRL: Über Effizienz hinaus – Quantisierungsverstärktes Verstärkungslernen für LLMs

Inversenfreie Wilson-Schleifen für Transformer: Ein praktischer Diagnoseansatz für Invarianz und Ordnungsempfindlichkeit

TUMIX: Multi-Agent Test-Time Scaling mit Werkzeugnutzungsmischung

R-Horizont: Wie weit kann Ihr großes Schlussfolgerungsmodell wirklich in Breite und Tiefe gehen?

AutoPR: Lassen Sie Ihre akademische Beförderung automatisieren!

Multimodale Prompt-Optimierung: Warum mehrere Modalitäten nicht für MLLMs genutzt werden sollten

TAG: Tangential Amplifying Guidance für hallucinationsresistente Diffusions-Sampling