Search for a command to run...
Vista-LLaMA: Reduzierung von Halluzinationen in Video-Sprachmodellen durch gleiche Distanz zu visuellen Tokens