Command Palette
Search for a command to run...
Papers
Täglich aktualisierte hochmoderne KI-Forschungsarbeiten, um Sie über die neuesten KI-Trends auf dem Laufenden zu halten

ARC-Hunyuan-Video-7B: Strukturierte Videoverstehen von realen Kurzfilmen

Agente Stärkung der Politik-Optimierung































ARC-Hunyuan-Video-7B: Strukturierte Videoverstehen von realen Kurzfilmen

Agente Stärkung der Politik-Optimierung






























Spezifikation Self-Correction: Verminderung von In-Context Reward Hacking Durch Testzeit-Verfeinerung
PRIX: Planen aus rohen Pixeln lernen für End-to-End-Autonome Fahrt
MMBench-GUI: Hierarchisches Multi-Plattform-Evaluierungsframework für GUI-Agenten
Deep Researcher mit Test-Time Diffusion
Die Geometrie der LLM-Quantisierung: GPTQ als Babai-Algorithmus des nächsten Ebenen
MedIQA: Ein skalierbares Grundmodell für promptgesteuerte medizinische Bildqualitätsbewertung
OS-MAP: Wie weit können Computer nutzende Agenten in Breite und Tiefe gehen?
Hierarchische Budget-Richtlinien-Optimierung für adaptives Reasoning
Captain Cinema: Towards Short Movie Generation
LAPO: Internalisierung der Recheneffizienz durch längeadaptive Policy-Optimierung
MUR: Momentum Unschärfe gestützte Reasoning für große Sprachmodelle
∇NABLA: Neighborhood Adaptive Block-Level Attention
Gruppenfolgepolitik-Optimierung
SafeWork-R1: Coevolution von Sicherheit und Intelligenz unter dem AI-45-Gesetz
Die Entkoppelung von Wissen und Reasoning in LLMs: Eine Untersuchung unter Verwendung der kognitiven Dual-System-Theorie
Re:Form – Reduzierung menschlicher Vorwissen bei skalierbarer formaler Softwareverifikation mit RL in LLMs: Eine Vorstudie zu Dafny
RAVine: Realitätsorientierte Bewertung für agenzbasiertes Suchen
Kann ein Bereich andere unterstützen? Eine datenorientierte Studie zum Multi-Domain-Reasoning durch Verstärkendes Lernen
DesignLab: Die Gestaltung von Folien durch iterative Erkennung und Korrektur
Yume: Ein interaktives Modell zur Weltgenerierung
Pixel, Muster, aber keine Poesie: Die Welt wie Menschen sehen
Die Konstruktion eines ophthalmologischen MLLM für die Positionierung-Diagnose-Kollaboration durch klinische kognitive Kettenreasoning
HySafe-AI: Hybrid Sicherheitsarchitekturanalyse-Rahmenwerk für KI-Systeme: Eine Fallstudie
Zebra-CoT: Ein Datensatz für abwechselnde visuelle Sprachbasierte Schlussfolgerung
Semi-off-Policy Verstärkendes Lernen für Vision-Language Langsamdenken Reasoning
Upsample What Matters: Region-Adaptive Latent Sampling for Accelerated Diffusion Transformers
MegaScience: Die Weiterentwicklung der Post-Training-Datensätze für wissenschaftliches Denken
Step-Audio 2 Technischer Bericht
Außerhalb der Kontextgrenzen: Unbewusste Fäden für die langfristige Reasoning
Frontier-KI-Risikomanagementrahmenwerk in der Praxis: Technischer Bericht zur Risikoanalyse
Spezifikation Self-Correction: Verminderung von In-Context Reward Hacking Durch Testzeit-Verfeinerung
PRIX: Planen aus rohen Pixeln lernen für End-to-End-Autonome Fahrt
MMBench-GUI: Hierarchisches Multi-Plattform-Evaluierungsframework für GUI-Agenten
Deep Researcher mit Test-Time Diffusion
Die Geometrie der LLM-Quantisierung: GPTQ als Babai-Algorithmus des nächsten Ebenen
MedIQA: Ein skalierbares Grundmodell für promptgesteuerte medizinische Bildqualitätsbewertung
OS-MAP: Wie weit können Computer nutzende Agenten in Breite und Tiefe gehen?
Hierarchische Budget-Richtlinien-Optimierung für adaptives Reasoning
Captain Cinema: Towards Short Movie Generation
LAPO: Internalisierung der Recheneffizienz durch längeadaptive Policy-Optimierung
MUR: Momentum Unschärfe gestützte Reasoning für große Sprachmodelle
∇NABLA: Neighborhood Adaptive Block-Level Attention
Gruppenfolgepolitik-Optimierung
SafeWork-R1: Coevolution von Sicherheit und Intelligenz unter dem AI-45-Gesetz
Die Entkoppelung von Wissen und Reasoning in LLMs: Eine Untersuchung unter Verwendung der kognitiven Dual-System-Theorie
Re:Form – Reduzierung menschlicher Vorwissen bei skalierbarer formaler Softwareverifikation mit RL in LLMs: Eine Vorstudie zu Dafny
RAVine: Realitätsorientierte Bewertung für agenzbasiertes Suchen
Kann ein Bereich andere unterstützen? Eine datenorientierte Studie zum Multi-Domain-Reasoning durch Verstärkendes Lernen
DesignLab: Die Gestaltung von Folien durch iterative Erkennung und Korrektur
Yume: Ein interaktives Modell zur Weltgenerierung
Pixel, Muster, aber keine Poesie: Die Welt wie Menschen sehen
Die Konstruktion eines ophthalmologischen MLLM für die Positionierung-Diagnose-Kollaboration durch klinische kognitive Kettenreasoning
HySafe-AI: Hybrid Sicherheitsarchitekturanalyse-Rahmenwerk für KI-Systeme: Eine Fallstudie
Zebra-CoT: Ein Datensatz für abwechselnde visuelle Sprachbasierte Schlussfolgerung
Semi-off-Policy Verstärkendes Lernen für Vision-Language Langsamdenken Reasoning
Upsample What Matters: Region-Adaptive Latent Sampling for Accelerated Diffusion Transformers
MegaScience: Die Weiterentwicklung der Post-Training-Datensätze für wissenschaftliches Denken
Step-Audio 2 Technischer Bericht
Außerhalb der Kontextgrenzen: Unbewusste Fäden für die langfristige Reasoning
Frontier-KI-Risikomanagementrahmenwerk in der Praxis: Technischer Bericht zur Risikoanalyse