HyperAI

Hauptbereich

GPU

Konsole
Studio
Dokumente
Preise

Pulse

Neuigkeiten

Ressourcen

Fachartikel
Notebooks
Datensätze
Wiki

Benchmarks

SOTA
LLM-Modelle
GPU-Bestenliste

Community

Veranstaltungen

Tools

Über uns Nutzungsbedingungen Datenschutzerklärung
Deutsch

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Täglich aktualisierte hochmoderne KI-Forschungsarbeiten, um Sie über die neuesten KI-Trends auf dem Laufenden zu halten

Gestalten Sie die Zukunft der Künstlichen Intelligenz

Über uns

Über uns Support Hilfe zu Datensätzen

Produkte

Neuigkeiten Fachartikel Notebooks Datensätze Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Hauptbereich

GPU

Konsole
Studio
Dokumente
Preise

Pulse

Neuigkeiten

Ressourcen

Fachartikel
Notebooks
Datensätze
Wiki

Benchmarks

SOTA
LLM-Modelle
GPU-Bestenliste

Community

Veranstaltungen

Tools

Über uns Nutzungsbedingungen Datenschutzerklärung
Deutsch

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Täglich aktualisierte hochmoderne KI-Forschungsarbeiten, um Sie über die neuesten KI-Trends auf dem Laufenden zu halten

Gestalten Sie die Zukunft der Künstlichen Intelligenz

Über uns

Über uns Support Hilfe zu Datensätzen

Produkte

Neuigkeiten Fachartikel Notebooks Datensätze Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

MinerU2.5-Pro: Pushing the Limits of Data-Centric Document Parsing at Scale

MinerU2.5-Pro: Pushing the Limits of Data-Centric Document Parsing at Scale

Dokumentenverstehen

Bin Wang, Tianyao He, Linke Ouyang, et al.

Adams Gesetz: Das Gesetz der textuellen Frequenz in Large Language Models

Adams Gesetz: Das Gesetz der textuellen Frequenz in Large Language Models

Überwachtes Feinabstimmen

Hongyuan Adam Lu, Z.L., Victor Wei, et al.

OpenWorldLib: Eine vereinheitlichte Codebase und Definition von fortgeschrittenen World Models

DataFlow Team, Bohan Zeng, Daili Hua, et al.

WAXAL: Ein groß angelegtes mehrsprachiges Sprachkorpus afrikanischer Sprachen

Abdoulaye Diack, Perry Nelson, Kwaku Agbesi, et al.

DRACO: Ein Benchmark für die Domänenübergreifende Bewertung von Genauigkeit, Vollständigkeit und Objektivität bei tiefgehenden Forschungsarbeiten

Retrieval-Augmented Generation

Joey Zhong, Hao Zhang, Clare Southern, et al.

HuatuoGPT-o1: Hin zu komplexer medizinischer Reasoning mit LLMs

Junying Chen, Zhenyang Cai, Ke Ji, et al.

AgentSocialBench: Evaluating Privacy Risks in Human-Centered Agentic Social Networks

Prince Zizhuang Wang, Shuli Jiang

InCoder-32B-Thinking: Ein industrielles Code-World-Modell für das Thinking

Jian Yang, Wei Zhang, Jiajun Wu, et al.

Agentic-MME: Was bringt die agentic-Fähigkeit wirklich zur multimodalen Intelligenz?

Qianshan Wei, Yishan Yang, Siyi Wang, et al.

Token Warping unterstützt MLLMs dabei, aus nahen Blickwinkeln zu betrachten.

Multimodale Darstellung

Phillip Y. Lee, Chanho Park, Mingue Park, et al.

Selbstdestilliertes RLVR

Verstärkendes Lernen

Chenxu Yang, Chuanyu Qin, Qingyi Si, et al.

Ein einfacher Baseline-Ansatz für das Streaming-Video-Verständnis

Visuelle Fragebeantwortung

Yujiao Shen, Shulin Tian, Jingkang Yang, et al.

CORAL: Auf dem Weg zur autonomen Evolution multi-agentischer Systeme für die offene Entdeckung

Ao Qu, Han Zheng, Zijian Zhou, et al.

Steerable Visual Representations

Multimodale Darstellung

Jona Ruthardt, Manu Gaur, Deva Ramanan, et al.

SKILL0: In-Context Agentic Reinforcement Learning für die Skill-Internalization

Verstärkendes Lernen

Zhengxi Lu, Zhiyuan Yao, Jinyang Wu, et al.

Generative World Renderer

Diffusionsmodell

Zheng-Hui Huang, Zhixiang Wang, Jiaming Tan, et al.

Der latente Raum: Grundlagen, Evolution, Mechanismen, Fähigkeiten und Ausblick

Xinlei Yu, Zhangquan Chen, Yongbo He, et al.

DataFlex: Ein einheitliches Framework für datenzentriertes dynamisches Training von Large Language Models

Hao Liang, Zhengyang Zhao, Meiyi Qiang, et al.

QuitoBench: Ein hochwertiges Open-Source-Benchmark für die Zeitreihenvorhersage

Siqiao Xue, Zhaoyang Zhu, Wei Zhang, et al.

Vision2Web: Ein hierarchischer Benchmark für die visuelle Webentwicklung mit Agentenverifikation

Codegenerierung

Zehai He, Wenyi Hong, Zhen Yang, et al.

ViGoR-Bench: Wie weit sind visuelle generative Modelle von Zero-Shot-visuellen Reasonern entfernt?

Haonan Han, Jiancheng Huang, Xiaopeng Sun, et al.

MiroEval: Benchmarking Multimodal Deep Research Agents in Process and Outcome

Fangda Ye, Yuxin Hu, Pengxiang Zhu, et al.

Terminal Agents reichen für die Unternehmensautomatisierung aus

Patrice Bechard, Orlando Marquez Ayala, Emily Chen, et al.

ClawKeeper: Umfassender Schutz für OpenClaw-Agenten durch Skills, Plugins und Watcher

Songyang Liu, Chaozhuo Li, Chenxu Wang, et al.

Günstiges Bootstrap für eine schnelle Unsicherheitsquantifizierung des Stochastic Gradient Descent

Henry Lam, Zitong Wang

Generative AI ermöglicht den Aufbau struktureller Hirnnetzwerke aus fMRI-Daten durch symmetrisches Diffusion Learning.

Diffusionsmodell

Medizinische Bildgebung

Qiankun Zuo, Bangjun Lei, Wanyu Qiu, et al.

Frühes Verlassen von Predictive Coding-Neuronen-Netzwerken für Edge AI

Bildklassifikation

Alaa Zniber, Mounir Ghogho, Ouassim Karrakchou, et al.

Quadratischer Gradient: Ein einheitliches Framework, das Gradientenabstieg und Newton-artige Methoden durch die Synthese von Hessischen Matrizen und Gradienten verbindet

Der Kapazitätsbereich von Klassen von Produkt-Broadcast-Kanälen

Yanlin Geng, Amin Gohari, Chandra Nair, et al.

Colon-Bench: Ein agenter Workflow für die skalierbare dichte Läsionsannotation in Videos der vollständigen Koloskopie

Medizinische Bildgebung

Visuelle Fragebeantwortung

Abdullah Hamdi, Changchun Yang, Xin Gao

TOOLACE: DIE VORTEILE VON LLM-FUNKTIONSAUFRUFEN

Überwachtes Feinabstimmen

Weiwen Liu, Xu Huang, Xingshan Zeng, et al.

LightMover: Generative Light Movement mit Farb- und Intensitätssteuerung

Diffusionsmodell

Gengze Zhou, Tianyu Wang, Soo Ye Kim, et al.

MinerU2.5-Pro: Pushing the Limits of Data-Centric Document Parsing at Scale

MinerU2.5-Pro: Pushing the Limits of Data-Centric Document Parsing at Scale

Dokumentenverstehen

Bin Wang, Tianyao He, Linke Ouyang, et al.

Adams Gesetz: Das Gesetz der textuellen Frequenz in Large Language Models

Adams Gesetz: Das Gesetz der textuellen Frequenz in Large Language Models

Überwachtes Feinabstimmen

Hongyuan Adam Lu, Z.L., Victor Wei, et al.

OpenWorldLib: Eine vereinheitlichte Codebase und Definition von fortgeschrittenen World Models

DataFlow Team, Bohan Zeng, Daili Hua, et al.

WAXAL: Ein groß angelegtes mehrsprachiges Sprachkorpus afrikanischer Sprachen

Abdoulaye Diack, Perry Nelson, Kwaku Agbesi, et al.

DRACO: Ein Benchmark für die Domänenübergreifende Bewertung von Genauigkeit, Vollständigkeit und Objektivität bei tiefgehenden Forschungsarbeiten

Retrieval-Augmented Generation

Joey Zhong, Hao Zhang, Clare Southern, et al.

HuatuoGPT-o1: Hin zu komplexer medizinischer Reasoning mit LLMs

Junying Chen, Zhenyang Cai, Ke Ji, et al.

AgentSocialBench: Evaluating Privacy Risks in Human-Centered Agentic Social Networks

Prince Zizhuang Wang, Shuli Jiang

InCoder-32B-Thinking: Ein industrielles Code-World-Modell für das Thinking

Jian Yang, Wei Zhang, Jiajun Wu, et al.

Agentic-MME: Was bringt die agentic-Fähigkeit wirklich zur multimodalen Intelligenz?

Qianshan Wei, Yishan Yang, Siyi Wang, et al.

Token Warping unterstützt MLLMs dabei, aus nahen Blickwinkeln zu betrachten.

Multimodale Darstellung

Phillip Y. Lee, Chanho Park, Mingue Park, et al.

Selbstdestilliertes RLVR

Verstärkendes Lernen

Chenxu Yang, Chuanyu Qin, Qingyi Si, et al.

Ein einfacher Baseline-Ansatz für das Streaming-Video-Verständnis

Visuelle Fragebeantwortung

Yujiao Shen, Shulin Tian, Jingkang Yang, et al.

CORAL: Auf dem Weg zur autonomen Evolution multi-agentischer Systeme für die offene Entdeckung

Ao Qu, Han Zheng, Zijian Zhou, et al.

Steerable Visual Representations

Multimodale Darstellung

Jona Ruthardt, Manu Gaur, Deva Ramanan, et al.

SKILL0: In-Context Agentic Reinforcement Learning für die Skill-Internalization

Verstärkendes Lernen

Zhengxi Lu, Zhiyuan Yao, Jinyang Wu, et al.

Generative World Renderer

Diffusionsmodell

Zheng-Hui Huang, Zhixiang Wang, Jiaming Tan, et al.

Der latente Raum: Grundlagen, Evolution, Mechanismen, Fähigkeiten und Ausblick

Xinlei Yu, Zhangquan Chen, Yongbo He, et al.

DataFlex: Ein einheitliches Framework für datenzentriertes dynamisches Training von Large Language Models

Hao Liang, Zhengyang Zhao, Meiyi Qiang, et al.

QuitoBench: Ein hochwertiges Open-Source-Benchmark für die Zeitreihenvorhersage

Siqiao Xue, Zhaoyang Zhu, Wei Zhang, et al.

Vision2Web: Ein hierarchischer Benchmark für die visuelle Webentwicklung mit Agentenverifikation

Codegenerierung

Zehai He, Wenyi Hong, Zhen Yang, et al.

ViGoR-Bench: Wie weit sind visuelle generative Modelle von Zero-Shot-visuellen Reasonern entfernt?

Haonan Han, Jiancheng Huang, Xiaopeng Sun, et al.

MiroEval: Benchmarking Multimodal Deep Research Agents in Process and Outcome

Fangda Ye, Yuxin Hu, Pengxiang Zhu, et al.

Terminal Agents reichen für die Unternehmensautomatisierung aus

Patrice Bechard, Orlando Marquez Ayala, Emily Chen, et al.

ClawKeeper: Umfassender Schutz für OpenClaw-Agenten durch Skills, Plugins und Watcher

Songyang Liu, Chaozhuo Li, Chenxu Wang, et al.

Günstiges Bootstrap für eine schnelle Unsicherheitsquantifizierung des Stochastic Gradient Descent

Henry Lam, Zitong Wang

Generative AI ermöglicht den Aufbau struktureller Hirnnetzwerke aus fMRI-Daten durch symmetrisches Diffusion Learning.

Diffusionsmodell

Medizinische Bildgebung

Qiankun Zuo, Bangjun Lei, Wanyu Qiu, et al.

Frühes Verlassen von Predictive Coding-Neuronen-Netzwerken für Edge AI

Bildklassifikation

Alaa Zniber, Mounir Ghogho, Ouassim Karrakchou, et al.

Quadratischer Gradient: Ein einheitliches Framework, das Gradientenabstieg und Newton-artige Methoden durch die Synthese von Hessischen Matrizen und Gradienten verbindet

Der Kapazitätsbereich von Klassen von Produkt-Broadcast-Kanälen

Yanlin Geng, Amin Gohari, Chandra Nair, et al.

Colon-Bench: Ein agenter Workflow für die skalierbare dichte Läsionsannotation in Videos der vollständigen Koloskopie

Medizinische Bildgebung

Visuelle Fragebeantwortung

Abdullah Hamdi, Changchun Yang, Xin Gao

TOOLACE: DIE VORTEILE VON LLM-FUNKTIONSAUFRUFEN

Überwachtes Feinabstimmen

Weiwen Liu, Xu Huang, Xingshan Zeng, et al.

LightMover: Generative Light Movement mit Farb- und Intensitätssteuerung

Diffusionsmodell

Gengze Zhou, Tianyu Wang, Soo Ye Kim, et al.

OpenWorldLib: Eine vereinheitlichte Codebase und Definition von fortgeschrittenen World Models

WAXAL: Ein groß angelegtes mehrsprachiges Sprachkorpus afrikanischer Sprachen

DRACO: Ein Benchmark für die Domänenübergreifende Bewertung von Genauigkeit, Vollständigkeit und Objektivität bei tiefgehenden Forschungsarbeiten

HuatuoGPT-o1: Hin zu komplexer medizinischer Reasoning mit LLMs

AgentSocialBench: Evaluating Privacy Risks in Human-Centered Agentic Social Networks

InCoder-32B-Thinking: Ein industrielles Code-World-Modell für das Thinking

Agentic-MME: Was bringt die agentic-Fähigkeit wirklich zur multimodalen Intelligenz?

Token Warping unterstützt MLLMs dabei, aus nahen Blickwinkeln zu betrachten.

Selbstdestilliertes RLVR

Ein einfacher Baseline-Ansatz für das Streaming-Video-Verständnis

CORAL: Auf dem Weg zur autonomen Evolution multi-agentischer Systeme für die offene Entdeckung

Steerable Visual Representations

SKILL0: In-Context Agentic Reinforcement Learning für die Skill-Internalization

Generative World Renderer

Der latente Raum: Grundlagen, Evolution, Mechanismen, Fähigkeiten und Ausblick

DataFlex: Ein einheitliches Framework für datenzentriertes dynamisches Training von Large Language Models

QuitoBench: Ein hochwertiges Open-Source-Benchmark für die Zeitreihenvorhersage

Vision2Web: Ein hierarchischer Benchmark für die visuelle Webentwicklung mit Agentenverifikation

ViGoR-Bench: Wie weit sind visuelle generative Modelle von Zero-Shot-visuellen Reasonern entfernt?

MiroEval: Benchmarking Multimodal Deep Research Agents in Process and Outcome

Terminal Agents reichen für die Unternehmensautomatisierung aus

ClawKeeper: Umfassender Schutz für OpenClaw-Agenten durch Skills, Plugins und Watcher

Günstiges Bootstrap für eine schnelle Unsicherheitsquantifizierung des Stochastic Gradient Descent

Generative AI ermöglicht den Aufbau struktureller Hirnnetzwerke aus fMRI-Daten durch symmetrisches Diffusion Learning.

Frühes Verlassen von Predictive Coding-Neuronen-Netzwerken für Edge AI

Quadratischer Gradient: Ein einheitliches Framework, das Gradientenabstieg und Newton-artige Methoden durch die Synthese von Hessischen Matrizen und Gradienten verbindet

Der Kapazitätsbereich von Klassen von Produkt-Broadcast-Kanälen

Colon-Bench: Ein agenter Workflow für die skalierbare dichte Läsionsannotation in Videos der vollständigen Koloskopie

TOOLACE: DIE VORTEILE VON LLM-FUNKTIONSAUFRUFEN

LightMover: Generative Light Movement mit Farb- und Intensitätssteuerung

OpenWorldLib: Eine vereinheitlichte Codebase und Definition von fortgeschrittenen World Models

WAXAL: Ein groß angelegtes mehrsprachiges Sprachkorpus afrikanischer Sprachen

DRACO: Ein Benchmark für die Domänenübergreifende Bewertung von Genauigkeit, Vollständigkeit und Objektivität bei tiefgehenden Forschungsarbeiten

HuatuoGPT-o1: Hin zu komplexer medizinischer Reasoning mit LLMs

AgentSocialBench: Evaluating Privacy Risks in Human-Centered Agentic Social Networks

InCoder-32B-Thinking: Ein industrielles Code-World-Modell für das Thinking

Agentic-MME: Was bringt die agentic-Fähigkeit wirklich zur multimodalen Intelligenz?

Token Warping unterstützt MLLMs dabei, aus nahen Blickwinkeln zu betrachten.

Selbstdestilliertes RLVR

Ein einfacher Baseline-Ansatz für das Streaming-Video-Verständnis

CORAL: Auf dem Weg zur autonomen Evolution multi-agentischer Systeme für die offene Entdeckung

Steerable Visual Representations

SKILL0: In-Context Agentic Reinforcement Learning für die Skill-Internalization

Generative World Renderer

Der latente Raum: Grundlagen, Evolution, Mechanismen, Fähigkeiten und Ausblick

DataFlex: Ein einheitliches Framework für datenzentriertes dynamisches Training von Large Language Models

QuitoBench: Ein hochwertiges Open-Source-Benchmark für die Zeitreihenvorhersage

Vision2Web: Ein hierarchischer Benchmark für die visuelle Webentwicklung mit Agentenverifikation

ViGoR-Bench: Wie weit sind visuelle generative Modelle von Zero-Shot-visuellen Reasonern entfernt?

MiroEval: Benchmarking Multimodal Deep Research Agents in Process and Outcome

Terminal Agents reichen für die Unternehmensautomatisierung aus

ClawKeeper: Umfassender Schutz für OpenClaw-Agenten durch Skills, Plugins und Watcher

Günstiges Bootstrap für eine schnelle Unsicherheitsquantifizierung des Stochastic Gradient Descent

Generative AI ermöglicht den Aufbau struktureller Hirnnetzwerke aus fMRI-Daten durch symmetrisches Diffusion Learning.

Frühes Verlassen von Predictive Coding-Neuronen-Netzwerken für Edge AI

Quadratischer Gradient: Ein einheitliches Framework, das Gradientenabstieg und Newton-artige Methoden durch die Synthese von Hessischen Matrizen und Gradienten verbindet

Der Kapazitätsbereich von Klassen von Produkt-Broadcast-Kanälen

Colon-Bench: Ein agenter Workflow für die skalierbare dichte Läsionsannotation in Videos der vollständigen Koloskopie

TOOLACE: DIE VORTEILE VON LLM-FUNKTIONSAUFRUFEN

LightMover: Generative Light Movement mit Farb- und Intensitätssteuerung