Search for a command to run...
Vista-LLaMA : Réduction de l'hallucination dans les modèles linguistiques vidéo grâce à une distance égale aux tokens visuels