Search for a command to run...
Region-bewusstes Vortrainieren für die detektion von Objekten mit offenen Vokabularien unter Verwendung von Vision-Transformern