Command Palette
Search for a command to run...
Papers
Täglich aktualisierte hochmoderne KI-Forschungsarbeiten, um Sie über die neuesten KI-Trends auf dem Laufenden zu halten

Quadratischer Gradient: Ein einheitliches Framework, das Gradientenabstieg und Newton-artige Methoden durch die Synthese von Hessischen Matrizen und Gradienten verbindet

Der Kapazitätsbereich von Klassen von Produkt-Broadcast-Kanälen































Quadratischer Gradient: Ein einheitliches Framework, das Gradientenabstieg und Newton-artige Methoden durch die Synthese von Hessischen Matrizen und Gradienten verbindet

Der Kapazitätsbereich von Klassen von Produkt-Broadcast-Kanälen






























Colon-Bench: Ein agenter Workflow für die skalierbare dichte Läsionsannotation in Videos der vollständigen Koloskopie
TOOLACE: DIE VORTEILE VON LLM-FUNKTIONSAUFRUFEN
LightMover: Generative Light Movement mit Farb- und Intensitätssteuerung
Autonome Überholspur-Trajektorienoptimierung mittels Reinforcement Learning und Gegner-Pose-Schätzung
Make It Up: Fake Images, Real Gains in Generalized Few-shot Semantic Segmentation
Zweistufige akustische Anpassung mit gateden Cross-Attention-Adaptern für LLM-basierte Mehrsprecher-Spracherkennung
Ein vergleichender Studienansatz im Bereich der chirurgischen KI: Datensätze, Foundation Models und Barrieren auf dem Weg zu Med-AGI
Textdatenintegration
Einheitliche text-zu-Bewegungsgenerierung ohne numerische Kennung mittels Flow Matching
SEAR: Schema-basierte Evaluierung und Routing für LLM Gateways
Abstoßung in Echtzeit im kontextuellen Raum für eine hohe Diversität in Diffusion-Transformern
EpochX: Aufbau der Infrastruktur für eine emergente Agenten-Zivilisation
TAPS: aufgabenbewusste Vorschlagsverteilungen für spekulatives Sampling
Langschwanz-Fahrszenarien mit Reasoning Traces: Das KITScenes LongTail-Dataset
RealChart2Code: Fortschritte bei der Generierung von Code aus Diagrammen unter Verwendung realer Daten und einer Multi-Task-Evaluation
Trace2Skill: Trajektorien-lokale Lehren in übertragbare Agenten-Fähigkeiten destillieren
PackForcing: Kurze Videotraining reicht für die Langzeitvideoprobennahme und die Inferenz im Langkontext aus
ShotStream: Streaming Multi-Shot Video Generation für interaktives Storytelling
Aus den Augen, aber nicht aus dem Sinn: Hybride Speicher für dynamische Video-World-Models
BeSafe-Bench: Aufdeckung verhaltensbedingter Sicherheitsrisiken von situated Agents in funktionalen Umgebungen
World Reasoning Arena
MSA: Memory Sparse Attention für eine effiziente End-to-End-Skalierung von Memory-Modellen auf 100M Tokens
Voxtral TTS
RealRestorer: Auf dem Weg zu generalisierbarer Bildrestaurierung in realen Szenarien mit Large-Scale Image Editing Models
Calibri: Verbesserung von Diffusion-Transformern durch parameter-effiziente Kalibrierung
Intern-S1-Pro: Ein wissenschaftliches multimodales Grundmodell im Billionen-Skala-Bereich
PixelSmile: Auf dem Weg zu einer feinabgestimmten Bearbeitung von Gesichtsausdrücken
Claudini: Autoresearch entdeckt State-of-the-Art Adversarial Attack Algorithmen für LLMs
AutoHarness: Verbesserung von LLM Agents durch die automatische Synthese eines Code Harness
GameplayQA: Ein Benchmark-Framework für die verhaltensdichte, POV-synchrone Mehrvideo-Verständnisanalyse von 3D-Virtual Agents
Colon-Bench: Ein agenter Workflow für die skalierbare dichte Läsionsannotation in Videos der vollständigen Koloskopie
TOOLACE: DIE VORTEILE VON LLM-FUNKTIONSAUFRUFEN
LightMover: Generative Light Movement mit Farb- und Intensitätssteuerung
Autonome Überholspur-Trajektorienoptimierung mittels Reinforcement Learning und Gegner-Pose-Schätzung
Make It Up: Fake Images, Real Gains in Generalized Few-shot Semantic Segmentation
Zweistufige akustische Anpassung mit gateden Cross-Attention-Adaptern für LLM-basierte Mehrsprecher-Spracherkennung
Ein vergleichender Studienansatz im Bereich der chirurgischen KI: Datensätze, Foundation Models und Barrieren auf dem Weg zu Med-AGI
Textdatenintegration
Einheitliche text-zu-Bewegungsgenerierung ohne numerische Kennung mittels Flow Matching
SEAR: Schema-basierte Evaluierung und Routing für LLM Gateways
Abstoßung in Echtzeit im kontextuellen Raum für eine hohe Diversität in Diffusion-Transformern
EpochX: Aufbau der Infrastruktur für eine emergente Agenten-Zivilisation
TAPS: aufgabenbewusste Vorschlagsverteilungen für spekulatives Sampling
Langschwanz-Fahrszenarien mit Reasoning Traces: Das KITScenes LongTail-Dataset
RealChart2Code: Fortschritte bei der Generierung von Code aus Diagrammen unter Verwendung realer Daten und einer Multi-Task-Evaluation
Trace2Skill: Trajektorien-lokale Lehren in übertragbare Agenten-Fähigkeiten destillieren
PackForcing: Kurze Videotraining reicht für die Langzeitvideoprobennahme und die Inferenz im Langkontext aus
ShotStream: Streaming Multi-Shot Video Generation für interaktives Storytelling
Aus den Augen, aber nicht aus dem Sinn: Hybride Speicher für dynamische Video-World-Models
BeSafe-Bench: Aufdeckung verhaltensbedingter Sicherheitsrisiken von situated Agents in funktionalen Umgebungen
World Reasoning Arena
MSA: Memory Sparse Attention für eine effiziente End-to-End-Skalierung von Memory-Modellen auf 100M Tokens
Voxtral TTS
RealRestorer: Auf dem Weg zu generalisierbarer Bildrestaurierung in realen Szenarien mit Large-Scale Image Editing Models
Calibri: Verbesserung von Diffusion-Transformern durch parameter-effiziente Kalibrierung
Intern-S1-Pro: Ein wissenschaftliches multimodales Grundmodell im Billionen-Skala-Bereich
PixelSmile: Auf dem Weg zu einer feinabgestimmten Bearbeitung von Gesichtsausdrücken
Claudini: Autoresearch entdeckt State-of-the-Art Adversarial Attack Algorithmen für LLMs
AutoHarness: Verbesserung von LLM Agents durch die automatische Synthese eines Code Harness
GameplayQA: Ein Benchmark-Framework für die verhaltensdichte, POV-synchrone Mehrvideo-Verständnisanalyse von 3D-Virtual Agents