Search for a command to run...
Rethinking Video ViTs: Sparse Video Tubes for Joint Image and Video Learning ビデオViTの再考:画像とビデオの統合学習のためのスパースビデオチューブ