Command Palette
Search for a command to run...
Papers
Täglich aktualisierte hochmoderne KI-Forschungsarbeiten, um Sie über die neuesten KI-Trends auf dem Laufenden zu halten

MOSS-Audio-Tokenizer: Skalierung von Audio-Tokenizern für zukünftige Audio-Grundmodellen

Lernen jenseits des Lehrers: Verallgemeinerte On-Policy-Distillation mit Belohnungsextrapolation































MOSS-Audio-Tokenizer: Skalierung von Audio-Tokenizern für zukünftige Audio-Grundmodellen

Lernen jenseits des Lehrers: Verallgemeinerte On-Policy-Distillation mit Belohnungsextrapolation






























DeepGen 1.0: Ein leichtgewichtiges, einheitliches multimodales Modell zur Weiterentwicklung der Bildgenerierung und -bearbeitung
Composition-RL: Ihre verifizierbaren Prompts für die Verstärkungslernmethoden großer Sprachmodelle zusammensetzen
Der Teufel hinter Moltbook: Anthropic Safety verschwindet stets in sich selbst entwickelnden KI-Gesellschaften
Zu autonomem mathematischen Forschen
Wann zu merken und wann aufzuhören: Gated Recurrent Memory für die Verarbeitung langen Kontexts
ASA: Aktivierungssteuerung für die Domänenanpassung beim Tool-Aufruf
PhyCritic: Multimodale Kritiker-Modelle für Physical AI
GENIUS: Generative Fluid Intelligence Evaluation Suite
Schritt 3,5 Flash: Öffnen einer frontier-ähnlichen Intelligenz mit 11B aktiven Parametern
World-VLA-Loop: Closed-Loop-Lernen eines Video-Weltmodells und einer VLA-Politik
Zu einer autonomen mathematischen Forschung
Agent World Model: Unendliche synthetische Umgebungen für agentenbasiertes Verstärkungslernen
P1-VL: Brückenschlag zwischen visueller Wahrnehmung und wissenschaftlichem Schlussfolgern in Physik-Olympiaden
Chain of Mindset: Denken mit adaptiven kognitiven Modi
UI-Venus-1.5 Technischer Bericht
Code2World: Ein GUI-Weltmodell durch renderbare Codegenerierung
OPUS: Hin zu einer effizienten und begründeten Datenauswahl bei der Vortrainierung großer Sprachmodelle in jeder Iteration
BagelVLA: Verbesserung der Langzeit-Manipulation durch abwechselnde Generierung von Vision-Sprache-Aktion
THINGS-data: Eine multimodale Sammlung großskaliger Datensätze zur Untersuchung von Objektrepräsentationen im menschlichen Gehirn und Verhalten
Präzise Vorhersage neuartiger biomolekularer Interaktionen mit IsoDDE
SKILLRL: Evolution von Agents durch rekursives, skill-augmentiertes Reinforcement Learning
LLaDA2.1: Beschleunigung der Textdiffusion durch Token-Editierung
Verringern von spärlichen Belohnungen durch Modellierung schrittweiser und langfristiger Stichprobeneffekte in flussbasiertem GRPO
Recurrent-Depth VLA: Implizite Skalierung des Testzeit-Computings von Vision-Language-Action-Modellen mittels latenter iterativer Reasoning
QuantaAlpha: Ein evolutionärer Rahmen für die LLM-getriebene Alpha-Entdeckung
Modality Gap-getriebenes Subspace-Alignment-Trainingsparadigma für multimodale Large Language Models
MOVA: Hin zu skalierbarer und synchroner Video-Audio-Generierung
MemoryLLM: Einsteckbares, interpretierbares Feed-Forward-Gedächtnis für Transformer
DreamDojo: Ein generalistisches Roboter-Weltmodell aus großskaligen menschlichen Videos
F-GRPO: Lassen Sie Ihre Policy nicht das Offensichtliche lernen und das Seltenen vergessen
DeepGen 1.0: Ein leichtgewichtiges, einheitliches multimodales Modell zur Weiterentwicklung der Bildgenerierung und -bearbeitung
Composition-RL: Ihre verifizierbaren Prompts für die Verstärkungslernmethoden großer Sprachmodelle zusammensetzen
Der Teufel hinter Moltbook: Anthropic Safety verschwindet stets in sich selbst entwickelnden KI-Gesellschaften
Zu autonomem mathematischen Forschen
Wann zu merken und wann aufzuhören: Gated Recurrent Memory für die Verarbeitung langen Kontexts
ASA: Aktivierungssteuerung für die Domänenanpassung beim Tool-Aufruf
PhyCritic: Multimodale Kritiker-Modelle für Physical AI
GENIUS: Generative Fluid Intelligence Evaluation Suite
Schritt 3,5 Flash: Öffnen einer frontier-ähnlichen Intelligenz mit 11B aktiven Parametern
World-VLA-Loop: Closed-Loop-Lernen eines Video-Weltmodells und einer VLA-Politik
Zu einer autonomen mathematischen Forschung
Agent World Model: Unendliche synthetische Umgebungen für agentenbasiertes Verstärkungslernen
P1-VL: Brückenschlag zwischen visueller Wahrnehmung und wissenschaftlichem Schlussfolgern in Physik-Olympiaden
Chain of Mindset: Denken mit adaptiven kognitiven Modi
UI-Venus-1.5 Technischer Bericht
Code2World: Ein GUI-Weltmodell durch renderbare Codegenerierung
OPUS: Hin zu einer effizienten und begründeten Datenauswahl bei der Vortrainierung großer Sprachmodelle in jeder Iteration
BagelVLA: Verbesserung der Langzeit-Manipulation durch abwechselnde Generierung von Vision-Sprache-Aktion
THINGS-data: Eine multimodale Sammlung großskaliger Datensätze zur Untersuchung von Objektrepräsentationen im menschlichen Gehirn und Verhalten
Präzise Vorhersage neuartiger biomolekularer Interaktionen mit IsoDDE
SKILLRL: Evolution von Agents durch rekursives, skill-augmentiertes Reinforcement Learning
LLaDA2.1: Beschleunigung der Textdiffusion durch Token-Editierung
Verringern von spärlichen Belohnungen durch Modellierung schrittweiser und langfristiger Stichprobeneffekte in flussbasiertem GRPO
Recurrent-Depth VLA: Implizite Skalierung des Testzeit-Computings von Vision-Language-Action-Modellen mittels latenter iterativer Reasoning
QuantaAlpha: Ein evolutionärer Rahmen für die LLM-getriebene Alpha-Entdeckung
Modality Gap-getriebenes Subspace-Alignment-Trainingsparadigma für multimodale Large Language Models
MOVA: Hin zu skalierbarer und synchroner Video-Audio-Generierung
MemoryLLM: Einsteckbares, interpretierbares Feed-Forward-Gedächtnis für Transformer
DreamDojo: Ein generalistisches Roboter-Weltmodell aus großskaligen menschlichen Videos
F-GRPO: Lassen Sie Ihre Policy nicht das Offensichtliche lernen und das Seltenen vergessen