Wiki
Wir haben Hunderte von verwandten Einträgen zusammengestellt, um Ihnen zu helfen, "künstliche Intelligenz" zu verstehen
MetaFold kann mit einer Vielzahl von Kleidungsstücken und einer großen Bandbreite an Sprachbefehlen umgehen und so verschiedene Aufgaben zum Falten von Kleidung effizient erledigen.
ST-Raptor übertrifft neun Basismodelle in der Antwortgenauigkeit um bis zu 20%.
SubLlME zielt darauf ab, eine effiziente und genaue Bewertung der Modellleistung durch Vorhersage der Rangfolgerelevanz zu erreichen, ohne dass eine vollständige Bewertung erforderlich ist.
BSC-Nav erstellt eine allozentrische kognitive Karte aus egozentrischen Trajektorien und kontextuellen Hinweisen und ruft dynamisch räumliches Wissen ab, das mit semantischen Zielen übereinstimmt.
Vorversuche zeigen, dass DPCL Sprache trennen und relativ ideale Ergebnisse erzielen kann.
Das Ziel des Dual-Mode-Annealing besteht darin, ein Modell zu entwickeln, das zwei verschiedene Reaktionsmodi erfassen kann: den Denkmodus und den Nicht-Denkmodus.
Das Kernprinzip von BPO besteht darin, adaptive Richtlinien zu erlernen, indem die Nutzen von Denk- und Nicht-Denkpfaden unter derselben Eingabeabfrage explizit verglichen werden.
BED-LLM wendet das Framework des sequentiellen Bayesschen Versuchsdesigns (BED) effektiv auf das Problem der interaktiven Informationssammlung mit LLMs an.
Im Vergleich zum LLaMA-Modell und anderen hochmodernen Basismodellen erreicht REFRAG eine deutliche Beschleunigung ohne Genauigkeitsverlust.
Als allgemeine und leichtgewichtige Lösung verbessert ATE die Praktikabilität der Bereitstellung von VLA-Modellen auf neuen Roboterplattformen und -aufgaben.
MoC bietet eine neue Blaupause für die nächste Generation skalierbarer und steuerbarer Modelle zur langfristigen Videogenerierung.
Das TiG-Framework ermöglicht es LLMs, durch die direkte Interaktion mit der Spielumgebung ein prozedurales Verständnis zu entwickeln und gleichzeitig ihre inhärenten Argumentations- und Interpretationsfähigkeiten beizubehalten.
LOVON zielt darauf ab, große Sprachmodelle für die hierarchische Aufgabenplanung in Verbindung mit einem visuellen Erkennungsmodell mit offenem Vokabular zu nutzen.
MP1 ist in der Lage, Bewegungstrajektorien direkt innerhalb einer einzigen Netzwerkfunktionsauswertung zu generieren.
Meta-Rater zielt darauf ab, die vier Dimensionen Fachwissen, Lesbarkeit, Argumentation und Sauberkeit mit vorhandenen Qualitätsindikatoren zu integrieren, indem optimale Gewichte erlernt werden.
MaCP zielt darauf ab, eine hervorragende Leistung bei der Feinabstimmung großer Basismodelle mit minimalem Parameter- und Speicheraufwand zu erzielen.
Contextual Engineering markiert einen Paradigmenwechsel in der LLM-Praxis vom „Prompt Engineering“ zum systematischen „Contextual Engineering“.
Imitationslernen erwirbt Strategien durch Lernen von Expertendemonstrationen
POET ist ein neuartiger reparametrisierter Trainingsalgorithmus
NSA kombiniert algorithmische Innovation und Hardwareoptimierung, um eine effiziente Langzeitkontextmodellierung zu erreichen.
Die verkörperte Navigation optimiert Navigationsrouten durch die Interaktion mit der physischen Welt über bewegliche Objekte.
DiC ist eine Diffusionsmodell-Architektur-Basislinie, die Geschwindigkeit und Leistung kombiniert
PCEvolve ist ein neuartiger API-gestützter Algorithmus
EBTs sind ein vielversprechendes neues Paradigma, das die Lern- und Denkfähigkeiten von Modellen gleichzeitig erweitern kann.