Command Palette
Search for a command to run...
Papers
Täglich aktualisierte hochmoderne KI-Forschungsarbeiten, um Sie über die neuesten KI-Trends auf dem Laufenden zu halten

Die Geometrie der LLM-Quantisierung: GPTQ als Babai-Algorithmus des nächsten Ebenen

MedIQA: Ein skalierbares Grundmodell für promptgesteuerte medizinische Bildqualitätsbewertung































Die Geometrie der LLM-Quantisierung: GPTQ als Babai-Algorithmus des nächsten Ebenen

MedIQA: Ein skalierbares Grundmodell für promptgesteuerte medizinische Bildqualitätsbewertung






























OS-MAP: Wie weit können Computer nutzende Agenten in Breite und Tiefe gehen?
Hierarchische Budget-Richtlinien-Optimierung für adaptives Reasoning
Captain Cinema: Towards Short Movie Generation
LAPO: Internalisierung der Recheneffizienz durch längeadaptive Policy-Optimierung
MUR: Momentum Unschärfe gestützte Reasoning für große Sprachmodelle
∇NABLA: Neighborhood Adaptive Block-Level Attention
Gruppenfolgepolitik-Optimierung
SafeWork-R1: Coevolution von Sicherheit und Intelligenz unter dem AI-45-Gesetz
Die Entkoppelung von Wissen und Reasoning in LLMs: Eine Untersuchung unter Verwendung der kognitiven Dual-System-Theorie
Re:Form – Reduzierung menschlicher Vorwissen bei skalierbarer formaler Softwareverifikation mit RL in LLMs: Eine Vorstudie zu Dafny
RAVine: Realitätsorientierte Bewertung für agenzbasiertes Suchen
Kann ein Bereich andere unterstützen? Eine datenorientierte Studie zum Multi-Domain-Reasoning durch Verstärkendes Lernen
DesignLab: Die Gestaltung von Folien durch iterative Erkennung und Korrektur
Yume: Ein interaktives Modell zur Weltgenerierung
Pixel, Muster, aber keine Poesie: Die Welt wie Menschen sehen
Die Konstruktion eines ophthalmologischen MLLM für die Positionierung-Diagnose-Kollaboration durch klinische kognitive Kettenreasoning
HySafe-AI: Hybrid Sicherheitsarchitekturanalyse-Rahmenwerk für KI-Systeme: Eine Fallstudie
Zebra-CoT: Ein Datensatz für abwechselnde visuelle Sprachbasierte Schlussfolgerung
Semi-off-Policy Verstärkendes Lernen für Vision-Language Langsamdenken Reasoning
Upsample What Matters: Region-Adaptive Latent Sampling for Accelerated Diffusion Transformers
MegaScience: Die Weiterentwicklung der Post-Training-Datensätze für wissenschaftliches Denken
Step-Audio 2 Technischer Bericht
Außerhalb der Kontextgrenzen: Unbewusste Fäden für die langfristige Reasoning
Frontier-KI-Risikomanagementrahmenwerk in der Praxis: Technischer Bericht zur Risikoanalyse
Unsicherheitsbewusste Wissens-Transformer für Peer-to-Peer-Energietrading mit Multi-Agenten-Verstärkungslernen
NoHumansRequired: Autonome Hochwertige Bildbearbeitung Dreiergruppen-Extraktion
Robuste 3D-Maske-basierte Teil-Level-Bearbeitung in 3D-Gaussian Splatting mit regulierter Score-Distillation-Sampling-Methode
WebShaper: Agentenbasierte Daten-Synthese durch Informationsbeschaffung Formalisierung
Das unsichtbare Leine: Warum RLVR seinem Ursprung nicht entkommen kann
GUI-G^2: Gaussian Reward Modeling für GUI Grounding
OS-MAP: Wie weit können Computer nutzende Agenten in Breite und Tiefe gehen?
Hierarchische Budget-Richtlinien-Optimierung für adaptives Reasoning
Captain Cinema: Towards Short Movie Generation
LAPO: Internalisierung der Recheneffizienz durch längeadaptive Policy-Optimierung
MUR: Momentum Unschärfe gestützte Reasoning für große Sprachmodelle
∇NABLA: Neighborhood Adaptive Block-Level Attention
Gruppenfolgepolitik-Optimierung
SafeWork-R1: Coevolution von Sicherheit und Intelligenz unter dem AI-45-Gesetz
Die Entkoppelung von Wissen und Reasoning in LLMs: Eine Untersuchung unter Verwendung der kognitiven Dual-System-Theorie
Re:Form – Reduzierung menschlicher Vorwissen bei skalierbarer formaler Softwareverifikation mit RL in LLMs: Eine Vorstudie zu Dafny
RAVine: Realitätsorientierte Bewertung für agenzbasiertes Suchen
Kann ein Bereich andere unterstützen? Eine datenorientierte Studie zum Multi-Domain-Reasoning durch Verstärkendes Lernen
DesignLab: Die Gestaltung von Folien durch iterative Erkennung und Korrektur
Yume: Ein interaktives Modell zur Weltgenerierung
Pixel, Muster, aber keine Poesie: Die Welt wie Menschen sehen
Die Konstruktion eines ophthalmologischen MLLM für die Positionierung-Diagnose-Kollaboration durch klinische kognitive Kettenreasoning
HySafe-AI: Hybrid Sicherheitsarchitekturanalyse-Rahmenwerk für KI-Systeme: Eine Fallstudie
Zebra-CoT: Ein Datensatz für abwechselnde visuelle Sprachbasierte Schlussfolgerung
Semi-off-Policy Verstärkendes Lernen für Vision-Language Langsamdenken Reasoning
Upsample What Matters: Region-Adaptive Latent Sampling for Accelerated Diffusion Transformers
MegaScience: Die Weiterentwicklung der Post-Training-Datensätze für wissenschaftliches Denken
Step-Audio 2 Technischer Bericht
Außerhalb der Kontextgrenzen: Unbewusste Fäden für die langfristige Reasoning
Frontier-KI-Risikomanagementrahmenwerk in der Praxis: Technischer Bericht zur Risikoanalyse
Unsicherheitsbewusste Wissens-Transformer für Peer-to-Peer-Energietrading mit Multi-Agenten-Verstärkungslernen
NoHumansRequired: Autonome Hochwertige Bildbearbeitung Dreiergruppen-Extraktion
Robuste 3D-Maske-basierte Teil-Level-Bearbeitung in 3D-Gaussian Splatting mit regulierter Score-Distillation-Sampling-Methode
WebShaper: Agentenbasierte Daten-Synthese durch Informationsbeschaffung Formalisierung
Das unsichtbare Leine: Warum RLVR seinem Ursprung nicht entkommen kann
GUI-G^2: Gaussian Reward Modeling für GUI Grounding