HyperAIHyperAI
il y a 2 mois

TransNet V2 : Une architecture de réseau profond efficace pour la détection rapide des transitions de plans

Souček, Tomáš ; Lokoč, Jakub
TransNet V2 : Une architecture de réseau profond efficace pour la détection rapide des transitions de plans
Résumé

Bien que les approches de détection automatique des transitions de plans soient étudiées depuis plus de deux décennies, un modèle universel efficace au niveau humain n'a pas encore été proposé. Même pour des transitions de plans courantes comme les coupures nettes (hard cuts) ou les changements graduels simples, la diversité potentielle des contenus vidéo analysés peut toujours entraîner à la fois des faux positifs et des faux négatifs. Récemment, les approches basées sur l'apprentissage profond ont considérablement amélioré la précision de la détection des transitions de plans en utilisant des architectures de convolution 3D et des données d'entraînement artificiellement créées. Néanmoins, une précision de cent pour cent reste un idéal inaccessible. Dans cet article, nous partageons la version actuelle de notre réseau neuronal profond TransNet V2 qui atteint des performances de pointe sur des benchmarks reconnus. Une instance pré-entraînée du modèle est fournie afin qu'elle puisse être immédiatement utilisée par la communauté pour une analyse très efficace d'archives vidéo importantes. De plus, l'architecture du réseau ainsi que notre expérience du processus d'entraînement sont détaillées, incluant des extraits de code simples pour faciliter l'utilisation du modèle proposé et la visualisation des résultats.

TransNet V2 : Une architecture de réseau profond efficace pour la détection rapide des transitions de plans | Articles de recherche récents | HyperAI