Search for a command to run...
CLIPSelf : Un Vision Transformer qui se distille lui-même pour la prédiction dense à vocabulaire ouvert