Localisation d'Action Temporelle
La localisation temporelle d'actions est une sous-tâche dans le domaine de la vision par ordinateur qui vise à détecter les activités au sein des flux vidéo et à fournir leurs horodatages de début et de fin. Cette tâche fournit un soutien crucial pour des applications telles que l'analyse vidéo, la surveillance et la recherche de contenu en localisant précisément les moments où les actions se produisent dans une vidéo. Elle est étroitement liée à la génération de propositions temporelles d'actions, ce qui peut efficacement améliorer la précision et l'efficacité de la compréhension vidéo.
THUMOS’14
TSP
ActivityNet-1.3
AVFusion
HACS
TriDet (SlowFast)
FineAction
BMN (i3d feaure)
MultiTHUMOS
TriDet (VideoMAEv2)
CrossTask
VideoCLIP
EPIC-KITCHENS-100
AdaTAD (verb, VideoMAE-L)
MUSES
TemporalMaxer
ActivityNet-1.2
DeepMetricLearner
Ego4D MQ test
ActionFormer (SlowFast+Omnivore+EgoVLP)
Ego4D MQ val
MEXaction2
S-CNN
THUMOS'14
AVFusion
THUMOS14
BasicTAD (R50-SlowOnly)