HyperAIHyperAI

Command Palette

Search for a command to run...

Couche de Mélange Gaussien Temporelle pour Vidéos

AJ Piergiovanni Michael S. Ryoo

Résumé

Nous présentons une nouvelle couche de convolution nommée la couche Temporal Gaussian Mixture (TGM) et expliquons comment elle peut être utilisée pour capturer efficacement des informations temporelles à long terme dans des vidéos d'activités continues. La couche TGM est une couche de convolution temporelle régulée par un ensemble beaucoup plus restreint de paramètres (par exemple, l'emplacement/variance des Gaussiennes) qui sont entièrement différentiables. Nous exposons nos modèles vidéo entièrement convolutifs intégrant plusieurs couches TGM pour la détection d'activités. Les expériences approfondies menées sur plusieurs jeux de données, dont Charades et MultiTHUMOS, confirment l'efficacité des couches TGM, surpassant significativement les méthodes actuelles de pointe.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp