HyperAI

Hauptbereich

GPU

Konsole
Studio
Dokumente
Preise

Pulse

Neuigkeiten

Ressourcen

Fachartikel
Notebooks
Datensätze
Wiki

Benchmarks

SOTA
LLM-Modelle
GPU-Bestenliste

Community

Veranstaltungen

Tools

Über uns Nutzungsbedingungen Datenschutzerklärung
Deutsch

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Täglich aktualisierte hochmoderne KI-Forschungsarbeiten, um Sie über die neuesten KI-Trends auf dem Laufenden zu halten

Gestalten Sie die Zukunft der Künstlichen Intelligenz

Über uns

Über uns Support Hilfe zu Datensätzen

Produkte

Neuigkeiten Fachartikel Notebooks Datensätze Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Hauptbereich

GPU

Konsole
Studio
Dokumente
Preise

Pulse

Neuigkeiten

Ressourcen

Fachartikel
Notebooks
Datensätze
Wiki

Benchmarks

SOTA
LLM-Modelle
GPU-Bestenliste

Community

Veranstaltungen

Tools

Über uns Nutzungsbedingungen Datenschutzerklärung
Deutsch

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Täglich aktualisierte hochmoderne KI-Forschungsarbeiten, um Sie über die neuesten KI-Trends auf dem Laufenden zu halten

Gestalten Sie die Zukunft der Künstlichen Intelligenz

Über uns

Über uns Support Hilfe zu Datensätzen

Produkte

Neuigkeiten Fachartikel Notebooks Datensätze Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

LingxiDiagBench: Ein Multi-Agent-Framework zum Benchmarking von LLMs in der chinesischen psychiatrischen Beratung und Diagnose

LingxiDiagBench: Ein Multi-Agent-Framework zum Benchmarking von LLMs in der chinesischen psychiatrischen Beratung und Diagnose

Shihao Xu, Tiancheng Zhou, Jiatong Ma, et al.

AOHP: Ein Open-Source-Agent-Harness auf Betriebssystemebene für personalisierte, effiziente und sichere Interaktion

AOHP: Ein Open-Source-Agent-Harness auf Betriebssystemebene für personalisierte, effiziente und sichere Interaktion

Shanhui Zhao, Jiacheng Liu, Guohong Liu, et al.

MemGUI-Agent: Ein End-to-End Langzeit-Mobil-GUI-Agent mit proaktivem Kontextmanagement

Guangyi Liu, Gao Wu, Congxiao Liu, et al.

MobileForge: Annotation-freie Anpassung für mobile GUI-Agents mit hierarchischer feedbackgeführter Policy-Optimierung

Guangyi Liu, Pengxiang Zhao, Gao Wu, et al.

NatureBench: Können Coding Agents den veröffentlichten SOTA von Nature-Family-Publikationen erreichen?

KI Für Die Wissenschaft

Yuru Wang, Lejun Cheng, Yuxin Zuo, et al.

Qwen-AgentWorld: Sprachweltmodelle für allgemeine Agents

Yuxin Zuo, Zikai Xiao, Li Sheng, et al.

Überdenken der Trainingsziele, Architekturen und Datenqualität für universelle Spracher enhancement

Audio- Und Sprachverarbeitung

Szu-Wei Fu, Rong Chao, Xuesong Yang, et al.

Generative 3D-Gausssche mit erlernter Dichtesteuerung

Diffusionsmodell

Runjie Yan, Yan-Pei Cao, Peng Wang, et al.

TADA: Ein generativer Rahmenwerk für die Sprachmodellierung durch text-akustische Dualausrichtung

Trung Dang, Sharath Rao, Ananya Gupta, et al.

Über isolierte Wörter hinaus: Diffusion Brush für die Generierung von handschriftlichen Textzeilen

Diffusionsmodell

Bildgenerierung

Gang Dai, Yifan Zhang, Yutao Qin, et al.

gsplat: Eine Open-Source-Bibliothek für Gaussian Splatting

Vickie Ye, Ruilong Li, Justin Kerr, et al.

OmniVideo-100K: Ein Datensatz für audio-visuelle Schlussfolgerungen durch strukturierte Skripte und Evidenzketten

Visuelle Fragebeantwortung

Xinyue Cai, Chaoyou Fu, Yi-Fan Zhang, et al.

OPEN-SWE-TRACES: Fortschritte in der dualmodigen mehrsprachigen Distillation für Software Engineering Agents

Codegenerierung

Textgenerierung

Wasi Uddin Ahmad, Nikolai Ludwig, Somshubra Majumdar, et al.

Credit Assignment mit Resets in der Sprachmodell-Reasoning

Verstärkendes Lernen

Ankur Samanta, Akshayaa Magesh, Ayush Jain, et al.

Unbegrenzte OCR-Funktionalitäten: Begrüßung der Ära des One-shot Long-horizon Parsing

Baoding Zhou, Jingyun Wang, Xiaolin Wei, et al.

PlanBench-XL: Evaluation der Langzeitplanung von LLM Tool-Use Agents in großskaligen Tool-Ökosystemen

Jiayu Liu, Qihan Lin, Cheng Qian, et al.

OpenRath: Sitzungszentrierter Laufzeitstatus für Agent-Systeme

Fukang Wen, Zhijie Wang, Ruilin Xu

EvoEmbedding: Evolutionäre Repräsentationen für Langkontext-Abfrage und agentisches Gedächtnis

Retrieval-Augmented Generation

Chang Nie, Chaoyou Fu, Junlan Feng, et al.

Lernen aus den eigenen Fehlern: Konstruktion lernbarer mikroreflexiver Trajektorien für die Selbstdistillation

Verstärkendes Lernen

Zhilin Huang, Hang Gao, Ziqiang Dong, et al.

Weltaktionsmodelle: Eine Übersicht

Qiuhong Shen, Shihua Zhang, Yue Liao, et al.

KaLM-Reranker-V1: Schnell, aber keine späte Interaktion für das Reranking komprimierter Dokumente

Xinping Zhao, Jiaxin Xu, Ziqi Dai, et al.

Neubewertung des Schrumpfungs-Bias bei der FP4-Pretrainierung von LLMs: Geometrischer Ursprung, systemische Auswirkungen und das UFP4-Rezept

Qian Zhao, Kunlong Chen, Changxin Tian, et al.

HydraHead: Von der funktionalen Heterogenität auf Head-Ebene zur spezialisierten Hybridisierung von Aufmerksamkeit

Zhentao Tan, Wei Chen, Jingyi Shen, et al.

3DCodeBench: Benchmarking Agentic Procedural 3D Modeling Via Code

Codegenerierung

Yipeng Gao, Lei Shu, Genzhi Ye, et al.

RadImageNet-VQA: Ein großflächiger CT- und MRI-Datensatz für radiologische visuelle Fragen-und-Antworten-Aufgaben

Medizinische Bildgebung

Visuelle Fragebeantwortung

Leo Butsanets, Charles Corbiere, Julien Khlaut, et al.

Training von Software-Engineering-Agenten und Verifikatoren mit SWE-Gym

Überwachtes Feinabstimmen

Jiayi Pan, Xingyao Wang, Graham Neubig, et al.

MAKIEVAL: Ein mehrsprachiges automatisches Framework auf Grundlage von WiKIdata zur Evaluierung der kulturellen Sensibilität von LLMs

Textgenerierung

Raoyuan Zhao, Beiduo Chen, Barbara Plank, et al.

GeneralVLA-2: Geometriebewusste Rekonstruktion und gesteuerter Speicher für die Roboterplanung

3D-Maschinenvision

Retrieval-Augmented Generation

Haoyu Wang, Guoqing Ma, Zeyu Zhang, et al.

Mehrfach-Reflektives Masking ermöglicht das Schlussfolgern in Mask-Diffusionsmodellen

Diffusionsmodell

Textgenerierung

Yanming Zhang, Yihan Bian, Jingyuan Qi, et al.

BrainG3N: Ein Tokenizer mit zwei Verwendungszwecken zur kontrollierbaren 3D-Gehirn-MRT-Generierung

Diffusionsmodell

Max Van Puyvelde, Ibrahim Gulluk, Wim Van Criekinge, et al.

GateMem: Benchmarking der Speicherverwaltung in Multi-Principal Shared-Memory Agents

Zhe Ren, Yibo Yang, Yimeng Chen, et al.

MemSlides: Ein hierarchisches, gedächtnisgesteuertes Agent-Framework für die personalisierte Folien-Generierung mit mehrstufiger lokaler Überarbeitung

Ye Jin, Yangyang Xu, Jun Zhu, et al.

LingxiDiagBench: Ein Multi-Agent-Framework zum Benchmarking von LLMs in der chinesischen psychiatrischen Beratung und Diagnose

LingxiDiagBench: Ein Multi-Agent-Framework zum Benchmarking von LLMs in der chinesischen psychiatrischen Beratung und Diagnose

Shihao Xu, Tiancheng Zhou, Jiatong Ma, et al.

AOHP: Ein Open-Source-Agent-Harness auf Betriebssystemebene für personalisierte, effiziente und sichere Interaktion

AOHP: Ein Open-Source-Agent-Harness auf Betriebssystemebene für personalisierte, effiziente und sichere Interaktion

Shanhui Zhao, Jiacheng Liu, Guohong Liu, et al.

MemGUI-Agent: Ein End-to-End Langzeit-Mobil-GUI-Agent mit proaktivem Kontextmanagement

Guangyi Liu, Gao Wu, Congxiao Liu, et al.

MobileForge: Annotation-freie Anpassung für mobile GUI-Agents mit hierarchischer feedbackgeführter Policy-Optimierung

Guangyi Liu, Pengxiang Zhao, Gao Wu, et al.

NatureBench: Können Coding Agents den veröffentlichten SOTA von Nature-Family-Publikationen erreichen?

KI Für Die Wissenschaft

Yuru Wang, Lejun Cheng, Yuxin Zuo, et al.

Qwen-AgentWorld: Sprachweltmodelle für allgemeine Agents

Yuxin Zuo, Zikai Xiao, Li Sheng, et al.

Überdenken der Trainingsziele, Architekturen und Datenqualität für universelle Spracher enhancement

Audio- Und Sprachverarbeitung

Szu-Wei Fu, Rong Chao, Xuesong Yang, et al.

Generative 3D-Gausssche mit erlernter Dichtesteuerung

Diffusionsmodell

Runjie Yan, Yan-Pei Cao, Peng Wang, et al.

TADA: Ein generativer Rahmenwerk für die Sprachmodellierung durch text-akustische Dualausrichtung

Trung Dang, Sharath Rao, Ananya Gupta, et al.

Über isolierte Wörter hinaus: Diffusion Brush für die Generierung von handschriftlichen Textzeilen

Diffusionsmodell

Bildgenerierung

Gang Dai, Yifan Zhang, Yutao Qin, et al.

gsplat: Eine Open-Source-Bibliothek für Gaussian Splatting

Vickie Ye, Ruilong Li, Justin Kerr, et al.

OmniVideo-100K: Ein Datensatz für audio-visuelle Schlussfolgerungen durch strukturierte Skripte und Evidenzketten

Visuelle Fragebeantwortung

Xinyue Cai, Chaoyou Fu, Yi-Fan Zhang, et al.

OPEN-SWE-TRACES: Fortschritte in der dualmodigen mehrsprachigen Distillation für Software Engineering Agents

Codegenerierung

Textgenerierung

Wasi Uddin Ahmad, Nikolai Ludwig, Somshubra Majumdar, et al.

Credit Assignment mit Resets in der Sprachmodell-Reasoning

Verstärkendes Lernen

Ankur Samanta, Akshayaa Magesh, Ayush Jain, et al.

Unbegrenzte OCR-Funktionalitäten: Begrüßung der Ära des One-shot Long-horizon Parsing

Baoding Zhou, Jingyun Wang, Xiaolin Wei, et al.

PlanBench-XL: Evaluation der Langzeitplanung von LLM Tool-Use Agents in großskaligen Tool-Ökosystemen

Jiayu Liu, Qihan Lin, Cheng Qian, et al.

OpenRath: Sitzungszentrierter Laufzeitstatus für Agent-Systeme

Fukang Wen, Zhijie Wang, Ruilin Xu

EvoEmbedding: Evolutionäre Repräsentationen für Langkontext-Abfrage und agentisches Gedächtnis

Retrieval-Augmented Generation

Chang Nie, Chaoyou Fu, Junlan Feng, et al.

Lernen aus den eigenen Fehlern: Konstruktion lernbarer mikroreflexiver Trajektorien für die Selbstdistillation

Verstärkendes Lernen

Zhilin Huang, Hang Gao, Ziqiang Dong, et al.

Weltaktionsmodelle: Eine Übersicht

Qiuhong Shen, Shihua Zhang, Yue Liao, et al.

KaLM-Reranker-V1: Schnell, aber keine späte Interaktion für das Reranking komprimierter Dokumente

Xinping Zhao, Jiaxin Xu, Ziqi Dai, et al.

Neubewertung des Schrumpfungs-Bias bei der FP4-Pretrainierung von LLMs: Geometrischer Ursprung, systemische Auswirkungen und das UFP4-Rezept

Qian Zhao, Kunlong Chen, Changxin Tian, et al.

HydraHead: Von der funktionalen Heterogenität auf Head-Ebene zur spezialisierten Hybridisierung von Aufmerksamkeit

Zhentao Tan, Wei Chen, Jingyi Shen, et al.

3DCodeBench: Benchmarking Agentic Procedural 3D Modeling Via Code

Codegenerierung

Yipeng Gao, Lei Shu, Genzhi Ye, et al.

RadImageNet-VQA: Ein großflächiger CT- und MRI-Datensatz für radiologische visuelle Fragen-und-Antworten-Aufgaben

Medizinische Bildgebung

Visuelle Fragebeantwortung

Leo Butsanets, Charles Corbiere, Julien Khlaut, et al.

Training von Software-Engineering-Agenten und Verifikatoren mit SWE-Gym

Überwachtes Feinabstimmen

Jiayi Pan, Xingyao Wang, Graham Neubig, et al.

MAKIEVAL: Ein mehrsprachiges automatisches Framework auf Grundlage von WiKIdata zur Evaluierung der kulturellen Sensibilität von LLMs

Textgenerierung

Raoyuan Zhao, Beiduo Chen, Barbara Plank, et al.

GeneralVLA-2: Geometriebewusste Rekonstruktion und gesteuerter Speicher für die Roboterplanung

3D-Maschinenvision

Retrieval-Augmented Generation

Haoyu Wang, Guoqing Ma, Zeyu Zhang, et al.

Mehrfach-Reflektives Masking ermöglicht das Schlussfolgern in Mask-Diffusionsmodellen

Diffusionsmodell

Textgenerierung

Yanming Zhang, Yihan Bian, Jingyuan Qi, et al.

BrainG3N: Ein Tokenizer mit zwei Verwendungszwecken zur kontrollierbaren 3D-Gehirn-MRT-Generierung

Diffusionsmodell

Max Van Puyvelde, Ibrahim Gulluk, Wim Van Criekinge, et al.

GateMem: Benchmarking der Speicherverwaltung in Multi-Principal Shared-Memory Agents

Zhe Ren, Yibo Yang, Yimeng Chen, et al.

MemSlides: Ein hierarchisches, gedächtnisgesteuertes Agent-Framework für die personalisierte Folien-Generierung mit mehrstufiger lokaler Überarbeitung

Ye Jin, Yangyang Xu, Jun Zhu, et al.

MemGUI-Agent: Ein End-to-End Langzeit-Mobil-GUI-Agent mit proaktivem Kontextmanagement

MobileForge: Annotation-freie Anpassung für mobile GUI-Agents mit hierarchischer feedbackgeführter Policy-Optimierung

NatureBench: Können Coding Agents den veröffentlichten SOTA von Nature-Family-Publikationen erreichen?

Qwen-AgentWorld: Sprachweltmodelle für allgemeine Agents

Überdenken der Trainingsziele, Architekturen und Datenqualität für universelle Spracher enhancement

Generative 3D-Gausssche mit erlernter Dichtesteuerung

TADA: Ein generativer Rahmenwerk für die Sprachmodellierung durch text-akustische Dualausrichtung

Über isolierte Wörter hinaus: Diffusion Brush für die Generierung von handschriftlichen Textzeilen

gsplat: Eine Open-Source-Bibliothek für Gaussian Splatting

OmniVideo-100K: Ein Datensatz für audio-visuelle Schlussfolgerungen durch strukturierte Skripte und Evidenzketten

OPEN-SWE-TRACES: Fortschritte in der dualmodigen mehrsprachigen Distillation für Software Engineering Agents

Credit Assignment mit Resets in der Sprachmodell-Reasoning

Unbegrenzte OCR-Funktionalitäten: Begrüßung der Ära des One-shot Long-horizon Parsing

PlanBench-XL: Evaluation der Langzeitplanung von LLM Tool-Use Agents in großskaligen Tool-Ökosystemen

OpenRath: Sitzungszentrierter Laufzeitstatus für Agent-Systeme

EvoEmbedding: Evolutionäre Repräsentationen für Langkontext-Abfrage und agentisches Gedächtnis

Lernen aus den eigenen Fehlern: Konstruktion lernbarer mikroreflexiver Trajektorien für die Selbstdistillation

Weltaktionsmodelle: Eine Übersicht

KaLM-Reranker-V1: Schnell, aber keine späte Interaktion für das Reranking komprimierter Dokumente

Neubewertung des Schrumpfungs-Bias bei der FP4-Pretrainierung von LLMs: Geometrischer Ursprung, systemische Auswirkungen und das UFP4-Rezept

HydraHead: Von der funktionalen Heterogenität auf Head-Ebene zur spezialisierten Hybridisierung von Aufmerksamkeit

3DCodeBench: Benchmarking Agentic Procedural 3D Modeling Via Code

RadImageNet-VQA: Ein großflächiger CT- und MRI-Datensatz für radiologische visuelle Fragen-und-Antworten-Aufgaben

Training von Software-Engineering-Agenten und Verifikatoren mit SWE-Gym

MAKIEVAL: Ein mehrsprachiges automatisches Framework auf Grundlage von WiKIdata zur Evaluierung der kulturellen Sensibilität von LLMs

GeneralVLA-2: Geometriebewusste Rekonstruktion und gesteuerter Speicher für die Roboterplanung

Mehrfach-Reflektives Masking ermöglicht das Schlussfolgern in Mask-Diffusionsmodellen

BrainG3N: Ein Tokenizer mit zwei Verwendungszwecken zur kontrollierbaren 3D-Gehirn-MRT-Generierung

GateMem: Benchmarking der Speicherverwaltung in Multi-Principal Shared-Memory Agents

MemSlides: Ein hierarchisches, gedächtnisgesteuertes Agent-Framework für die personalisierte Folien-Generierung mit mehrstufiger lokaler Überarbeitung

MemGUI-Agent: Ein End-to-End Langzeit-Mobil-GUI-Agent mit proaktivem Kontextmanagement

MobileForge: Annotation-freie Anpassung für mobile GUI-Agents mit hierarchischer feedbackgeführter Policy-Optimierung

NatureBench: Können Coding Agents den veröffentlichten SOTA von Nature-Family-Publikationen erreichen?

Qwen-AgentWorld: Sprachweltmodelle für allgemeine Agents

Überdenken der Trainingsziele, Architekturen und Datenqualität für universelle Spracher enhancement

Generative 3D-Gausssche mit erlernter Dichtesteuerung

TADA: Ein generativer Rahmenwerk für die Sprachmodellierung durch text-akustische Dualausrichtung

Über isolierte Wörter hinaus: Diffusion Brush für die Generierung von handschriftlichen Textzeilen

gsplat: Eine Open-Source-Bibliothek für Gaussian Splatting

OmniVideo-100K: Ein Datensatz für audio-visuelle Schlussfolgerungen durch strukturierte Skripte und Evidenzketten

OPEN-SWE-TRACES: Fortschritte in der dualmodigen mehrsprachigen Distillation für Software Engineering Agents

Credit Assignment mit Resets in der Sprachmodell-Reasoning

Unbegrenzte OCR-Funktionalitäten: Begrüßung der Ära des One-shot Long-horizon Parsing

PlanBench-XL: Evaluation der Langzeitplanung von LLM Tool-Use Agents in großskaligen Tool-Ökosystemen

OpenRath: Sitzungszentrierter Laufzeitstatus für Agent-Systeme

EvoEmbedding: Evolutionäre Repräsentationen für Langkontext-Abfrage und agentisches Gedächtnis

Lernen aus den eigenen Fehlern: Konstruktion lernbarer mikroreflexiver Trajektorien für die Selbstdistillation

Weltaktionsmodelle: Eine Übersicht

KaLM-Reranker-V1: Schnell, aber keine späte Interaktion für das Reranking komprimierter Dokumente

Neubewertung des Schrumpfungs-Bias bei der FP4-Pretrainierung von LLMs: Geometrischer Ursprung, systemische Auswirkungen und das UFP4-Rezept

HydraHead: Von der funktionalen Heterogenität auf Head-Ebene zur spezialisierten Hybridisierung von Aufmerksamkeit

3DCodeBench: Benchmarking Agentic Procedural 3D Modeling Via Code

RadImageNet-VQA: Ein großflächiger CT- und MRI-Datensatz für radiologische visuelle Fragen-und-Antworten-Aufgaben

Training von Software-Engineering-Agenten und Verifikatoren mit SWE-Gym

MAKIEVAL: Ein mehrsprachiges automatisches Framework auf Grundlage von WiKIdata zur Evaluierung der kulturellen Sensibilität von LLMs

GeneralVLA-2: Geometriebewusste Rekonstruktion und gesteuerter Speicher für die Roboterplanung

Mehrfach-Reflektives Masking ermöglicht das Schlussfolgern in Mask-Diffusionsmodellen

BrainG3N: Ein Tokenizer mit zwei Verwendungszwecken zur kontrollierbaren 3D-Gehirn-MRT-Generierung

GateMem: Benchmarking der Speicherverwaltung in Multi-Principal Shared-Memory Agents

MemSlides: Ein hierarchisches, gedächtnisgesteuertes Agent-Framework für die personalisierte Folien-Generierung mit mehrstufiger lokaler Überarbeitung