Search for a command to run...
Von Text zu Maske: Lokalisierung von Entitäten unter Verwendung der Aufmerksamkeit von Text-zu-Bild-Diffusionsmodellen