Search for a command to run...
Verstärktes Cross-Modales Matching und Selbstüberwachtes Imitationslernen für die Vision-Sprache-Navigation