Video Retrieval
コンピュータビジョンは、機械が画像や動画を解釈し理解する技術です。その目的は、人間の視覚システムを模倣することで複雑なシーンの自動認識と分析を達成することです。この技術は、医療画像診断、自動運転、セキュリティ監視などの分野で広く応用され、効率と精度を大幅に向上させ、知能化社会の発展に寄与しています。
ActivityNet
Ours
Charades-STA
PO Loss
Condensed Movies
TESTA (ViT-B/16)
DiDeMo
InternVideo
EgoExoLearn
FIVR-200K
S2VS
LSMDC
UMT-L (ViT-L/16)
MSR-VTT
CLIP2TV
MSR-VTT-1kA
HunYuan_tvr
MSVD
HunYuan_tvr
MSVD-Indonesian
X-CLIP (Cross-Lingual)
QuerYD
RUDDER
PO Loss
SSv2-label retrieval
SSv2-template retrieval
UMT-L (ViT-L/16)
TGIF
TVR
Hero w/ pre-training
VATEX
InternVideo
YouCook2
COOT