HyperAIHyperAI

Command Palette

Search for a command to run...

Fahren lernen in einer Welt auf Schienen

Dian Chen Vladlen Koltun Philipp Krähenbühl

Zusammenfassung

Wir lernen eine interaktive, visionbasierte Fahrpolitik aus vorher aufgezeichneten Fahrprotokollen durch einen modellbasierten Ansatz. Ein Vorwärtsmodell der Welt überwacht eine Fahrpolitik, die das Ergebnis jeder potentiellen Fahrtrajektorie voraussagt. Um das Lernen aus vorher aufgezeichneten Protokollen zu unterstützen, gehen wir davon aus, dass die Welt „auf Schienen“ ist, was bedeutet, weder der Agent noch seine Aktionen beeinflussen die Umgebung. Diese Annahme vereinfacht das Lernproblem erheblich und faktorisiert die Dynamik in ein nichtreaktives Weltmodell und ein niedrigdimensionales und kompaktes Vorwärtsmodell des Ego-Fahrzeugs. Unser Ansatz berechnet Aktionswerte für jede Trainings-Trajektorie unter Verwendung einer tabellarischen dynamischen Programmierung zur Bewertung der Bellman-Gleichungen; diese Aktionswerte überwachen ihrerseits die endgültige visionbasierte Fahrpolitik. Trotz der Annahme einer Welt „auf Schienen“ agiert die endgültige Fahrpolitik gut in einer dynamischen und reaktiven Welt. Zum Zeitpunkt des Schreibens rangiert unsere Methode an erster Stelle auf dem CARLA-Leaderboard und erreicht dabei einen 25 % höheren Fahren-Score, während sie gleichzeitig 40-mal weniger Daten verwendet. Unsere Methode ist auch um ein Vielfaches dateneffizienter als state-of-the-art modellfreie Reinforcement-Learning-Techniken bei Navigationsaufgaben im ProcGen-Benchmark.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp