Command Palette
Search for a command to run...
Papers
Täglich aktualisierte hochmoderne KI-Forschungsarbeiten, um Sie über die neuesten KI-Trends auf dem Laufenden zu halten

ViMU: Benchmarking Video Metaphorical Understanding

SMOL: Professionell übersetzte parallele Daten für 115 unterrepräsentierte Sprachen































ViMU: Benchmarking Video Metaphorical Understanding

SMOL: Professionell übersetzte parallele Daten für 115 unterrepräsentierte Sprachen






























Chi-Bench: Können KI-Agenten end-to-End-Prozesse in der Gesundheitsversorgung mit langer Horizontdauer und hoher Politikhäufigkeit automatisieren?
Kombination von On-Policy-Optimierung und Distillation für langkontextuelle Schlussfolgerungen in großen Sprachmodellen
Durch den Blickwinkel des Kontrasts: Selbstverbessernde visuelle Schlussfolgerung in VLMs
HRM-Text: Effizientes Pretraining jenseits des Skalierens
Sehen, was ich meine: Ausrichten von Vision- und Sprachrepräsentationen für das feinkörnige Objektverständnis in Videos
Technischer Bericht zu StepAudio 2.5
SciAtlas: Ein wissensgraph im großen Maßstab für die automatisierte wissenschaftliche Forschung
Neubewertung der cross-layer Informationsrouting in Diffusion Transformers
Lens: Überdenken der Trainings-Effizienz für fundamentale Text-zu-Bild-Modelle
SkillOpt: Exekutive Strategie für sich selbst entwickelnde Agenten-Fähigkeiten
CVEvolve: Autonome Algorithmenentwicklung für die Verarbeitung unstrukturierter wissenschaftlicher Daten
Poly-EPO: Training explorative Modellierungsansätze
Zusammenfassung
ACC: Kompilieren von Agenten-Trajektorien für das Training mit langem Kontext
Volle Aufmerksamkeit schlägt zurück: Übertragung von voller Aufmerksamkeit auf Sparse innerhalb von hundert Trainingsschritten
π-Bench: Evaluierung proaktiver persönlicher Assistenten-Agents in langfristigen Workflows
Wahrnehmung oder Vorurteil: Können MLLMs über erste Eindrücke der Persönlichkeit hinausgehen?
TransitLM: Ein großskaliger Datensatz und Benchmark für die Generierung von Transitrouten ohne Karte
DelTA: Diskriminative Token-Credit-Zuweisung für Verstärkungslernen aus überprüfbaren Belohnungen
Interaktive Bewertung erfordert eine Designwissenschaft
ESI-BENCH: Auf dem Weg zu einer verkörperten räumlichen Intelligenz, die die Wahrnehmungs-Aktions-Schließung ermöglicht
Vergleichende Analyse der militärischen Detektion unter Verwendung von Drohnenbildern über mehrere visuelle Spektrumbereiche
Automatisierte ICD-Klassifizierung psychiatrischer Diagnosen: Von klassischem NLP zu großen Sprachmodellen
Koordiniertes optimales Power-Quality-Management in Verteilnetzen unter Nutzung der Restkapazität von Community-IBRs
EllipseLIO: Adaptive LiDAR-Inertial-Odometrie mit einer Ellipsoid-Darstellung
SMoA: Spektralmodulationsadapter für parameter-effizientes Feintuning
Erkennung von Trojaned DNNs durch spektrale Regressionsanalyse
Die Illusion des Denkens: Das Verständnis der Stärken und Grenzen von Reasoning-Modellen aus der Perspektive der Problemkomplexität
Generatives rekursives Reasoning
Safety Pretraining: Auf dem Weg zur nächsten Generation sicherer KI
Chi-Bench: Können KI-Agenten end-to-End-Prozesse in der Gesundheitsversorgung mit langer Horizontdauer und hoher Politikhäufigkeit automatisieren?
Kombination von On-Policy-Optimierung und Distillation für langkontextuelle Schlussfolgerungen in großen Sprachmodellen
Durch den Blickwinkel des Kontrasts: Selbstverbessernde visuelle Schlussfolgerung in VLMs
HRM-Text: Effizientes Pretraining jenseits des Skalierens
Sehen, was ich meine: Ausrichten von Vision- und Sprachrepräsentationen für das feinkörnige Objektverständnis in Videos
Technischer Bericht zu StepAudio 2.5
SciAtlas: Ein wissensgraph im großen Maßstab für die automatisierte wissenschaftliche Forschung
Neubewertung der cross-layer Informationsrouting in Diffusion Transformers
Lens: Überdenken der Trainings-Effizienz für fundamentale Text-zu-Bild-Modelle
SkillOpt: Exekutive Strategie für sich selbst entwickelnde Agenten-Fähigkeiten
CVEvolve: Autonome Algorithmenentwicklung für die Verarbeitung unstrukturierter wissenschaftlicher Daten
Poly-EPO: Training explorative Modellierungsansätze
Zusammenfassung
ACC: Kompilieren von Agenten-Trajektorien für das Training mit langem Kontext
Volle Aufmerksamkeit schlägt zurück: Übertragung von voller Aufmerksamkeit auf Sparse innerhalb von hundert Trainingsschritten
π-Bench: Evaluierung proaktiver persönlicher Assistenten-Agents in langfristigen Workflows
Wahrnehmung oder Vorurteil: Können MLLMs über erste Eindrücke der Persönlichkeit hinausgehen?
TransitLM: Ein großskaliger Datensatz und Benchmark für die Generierung von Transitrouten ohne Karte
DelTA: Diskriminative Token-Credit-Zuweisung für Verstärkungslernen aus überprüfbaren Belohnungen
Interaktive Bewertung erfordert eine Designwissenschaft
ESI-BENCH: Auf dem Weg zu einer verkörperten räumlichen Intelligenz, die die Wahrnehmungs-Aktions-Schließung ermöglicht
Vergleichende Analyse der militärischen Detektion unter Verwendung von Drohnenbildern über mehrere visuelle Spektrumbereiche
Automatisierte ICD-Klassifizierung psychiatrischer Diagnosen: Von klassischem NLP zu großen Sprachmodellen
Koordiniertes optimales Power-Quality-Management in Verteilnetzen unter Nutzung der Restkapazität von Community-IBRs
EllipseLIO: Adaptive LiDAR-Inertial-Odometrie mit einer Ellipsoid-Darstellung
SMoA: Spektralmodulationsadapter für parameter-effizientes Feintuning
Erkennung von Trojaned DNNs durch spektrale Regressionsanalyse
Die Illusion des Denkens: Das Verständnis der Stärken und Grenzen von Reasoning-Modellen aus der Perspektive der Problemkomplexität
Generatives rekursives Reasoning
Safety Pretraining: Auf dem Weg zur nächsten Generation sicherer KI