Search for a command to run...
LinVT: Verleihen Sie Ihrem bildbasierten großen Sprachmodell die Fähigkeit, Videos zu verstehen