Command Palette
Search for a command to run...
Papers
Täglich aktualisierte hochmoderne KI-Forschungsarbeiten, um Sie über die neuesten KI-Trends auf dem Laufenden zu halten

Fast Byte Latent Transformer

KI-Mitmathematiker: Beschleunigung von Mathematikern durch agentic AI































Fast Byte Latent Transformer

KI-Mitmathematiker: Beschleunigung von Mathematikern durch agentic AI






























HyperEyes: Dual-Grained Efficiency-Aware Reinforcement Learning für Parallele Multimodale Search Agents
Mean-Modus-Schreien: Mittelwert-Varianz-aufgeteilte Residuen für 1000-Schicht-Diffusions-Transformers
LLMs verbessern LLMs: Agentic Discovery für Test-Time Scaling
List-basierte Politikoptimierung: Gruppenbasierte RLVR als Zielprojektion auf das LLM-Antwort-Simplex
Flow-OPD: On-Policy-Distillation für Flow-Matching-Modelle
MACE-Dance: Bewegungs- und Erscheinungs-Kaskadierende Experten für musikgetriebene Tanzvideogenerierung
Erneutes Überdenken reasoning-intensiver Abrufmethoden: Bewertung und Verbesserung von Retrievers in agentic Search-Systemen
Wann ist der Phantasie zu vertrauen: Adaptive Handlungsexecution für World Action Models
RaguTeam bei SemEval-2026 Aufgabe 8: Meno und Freunde in einem von einem Richter orchestrierten LLM-Ensemble für glaubwürdige Mehrfachantwort-Generierung
MiA-Signatur: Annäherung an globale Aktivität zum Verständnis langer Kontexte
Continuous Latent Diffusion Language Model
Fähigkeit 1: Unified Evolution von mit Fähigkeiten erweiterten Agents durch Reinforcement Learning
Über die semantische Ähnlichkeit hinaus: Eine Neubewertung der retrieval-basierten Suche für agentic Search durch direkte Interaktion mit dem Korpus
MathNet: Ein globaler Multimodal-Benchmark für mathematisches Reasoning und Retrieval
D-OPSD: On-Policy Selbst-Distillation zur kontinuierlichen Feinabstimmung von step-distilled Diffusion Modellen
ZAYA1-8B Technischer Bericht
PhysForge: Generierung physikalisch fundierter 3D-Assets für interaktive virtuelle Welten
HERMES++: Auf dem Weg zu einem einheitlichen Fahrweltmodell für das Verständnis und die Generierung 3D-Szenen
OpenSearch-VL: Ein offenes Rezept für multimodale Such-Agents der neuesten Generation
Technischer Bericht RLDX-1
Stream-T1: Test-Time-Scaling für das Streamen der Video-Generierung
Stream-R1: Zuverlässigkeits-Perplexität-bewusste Belohnungs-Distillation für Streaming-Video-Generierung
Uni-OPD: Vereinheitlichung von On-Policy Distillation mit einer Dual-Perspective-Rezept
AGENTIC-IMODELS: Entwicklung agenterbasierter Interpretierbarkeitstools durch autoresearch
HEAVYSKILL: Schweres Denken als interne Fähigkeit in agenticen Systemen
WindowsWorld: Ein prozessorientierter Benchmark für autonome GUI-Agenten in professionellen, anwendungübergreifenden Umgebungen
Halluzinationen untergraben das Vertrauen; Metakognition ist ein Weg nach vorn
X2SAM: Segmentierung in Bildern und Videos
OpenSeeker-v2: Die Grenzen von Search Agents durch informative und hochkomplexe Trajektorien erweitern
PRISM: Pre-Alignment durch Black-Box On-Policy Distillation für Multimodales Reinforcement Learning
HyperEyes: Dual-Grained Efficiency-Aware Reinforcement Learning für Parallele Multimodale Search Agents
Mean-Modus-Schreien: Mittelwert-Varianz-aufgeteilte Residuen für 1000-Schicht-Diffusions-Transformers
LLMs verbessern LLMs: Agentic Discovery für Test-Time Scaling
List-basierte Politikoptimierung: Gruppenbasierte RLVR als Zielprojektion auf das LLM-Antwort-Simplex
Flow-OPD: On-Policy-Distillation für Flow-Matching-Modelle
MACE-Dance: Bewegungs- und Erscheinungs-Kaskadierende Experten für musikgetriebene Tanzvideogenerierung
Erneutes Überdenken reasoning-intensiver Abrufmethoden: Bewertung und Verbesserung von Retrievers in agentic Search-Systemen
Wann ist der Phantasie zu vertrauen: Adaptive Handlungsexecution für World Action Models
RaguTeam bei SemEval-2026 Aufgabe 8: Meno und Freunde in einem von einem Richter orchestrierten LLM-Ensemble für glaubwürdige Mehrfachantwort-Generierung
MiA-Signatur: Annäherung an globale Aktivität zum Verständnis langer Kontexte
Continuous Latent Diffusion Language Model
Fähigkeit 1: Unified Evolution von mit Fähigkeiten erweiterten Agents durch Reinforcement Learning
Über die semantische Ähnlichkeit hinaus: Eine Neubewertung der retrieval-basierten Suche für agentic Search durch direkte Interaktion mit dem Korpus
MathNet: Ein globaler Multimodal-Benchmark für mathematisches Reasoning und Retrieval
D-OPSD: On-Policy Selbst-Distillation zur kontinuierlichen Feinabstimmung von step-distilled Diffusion Modellen
ZAYA1-8B Technischer Bericht
PhysForge: Generierung physikalisch fundierter 3D-Assets für interaktive virtuelle Welten
HERMES++: Auf dem Weg zu einem einheitlichen Fahrweltmodell für das Verständnis und die Generierung 3D-Szenen
OpenSearch-VL: Ein offenes Rezept für multimodale Such-Agents der neuesten Generation
Technischer Bericht RLDX-1
Stream-T1: Test-Time-Scaling für das Streamen der Video-Generierung
Stream-R1: Zuverlässigkeits-Perplexität-bewusste Belohnungs-Distillation für Streaming-Video-Generierung
Uni-OPD: Vereinheitlichung von On-Policy Distillation mit einer Dual-Perspective-Rezept
AGENTIC-IMODELS: Entwicklung agenterbasierter Interpretierbarkeitstools durch autoresearch
HEAVYSKILL: Schweres Denken als interne Fähigkeit in agenticen Systemen
WindowsWorld: Ein prozessorientierter Benchmark für autonome GUI-Agenten in professionellen, anwendungübergreifenden Umgebungen
Halluzinationen untergraben das Vertrauen; Metakognition ist ein Weg nach vorn
X2SAM: Segmentierung in Bildern und Videos
OpenSeeker-v2: Die Grenzen von Search Agents durch informative und hochkomplexe Trajektorien erweitern
PRISM: Pre-Alignment durch Black-Box On-Policy Distillation für Multimodales Reinforcement Learning