HyperAIHyperAI
il y a 13 jours

TrackNetV2 : Réseau efficace de suivi de volant

{Tsì-Uí İk, Ho-Yi Chung, Dung-Ru Yu, Tzu-Han Hsu, Shao-Ping Chuang, Yu-Ching Lin, Nien-En Sun}
Résumé

TrackNet, un réseau de deep learning, a été proposé pour suivre des objets à haute vitesse et de petite taille, tels que des balles de tennis ou des volants, à partir de vidéos. Pour surmonter les problèmes liés à la faible qualité d’image, tels que le flou, les images fantômes ou les occlusions à court terme, un certain nombre d’images consécutives sont introduites simultanément afin de détecter un objet en mouvement. Dans ce travail, TrackNetV2 est proposé afin d’améliorer les performances de TrackNet sous plusieurs aspects, notamment la vitesse de traitement, la précision de prédiction et l’utilisation de la mémoire GPU. Premièrement, la vitesse de traitement est passée de 2,6 FPS à 31,8 FPS. Cette amélioration est obtenue en réduisant la taille des images d’entrée et en réingénierant le réseau, en le transformant d’un schéma Multiple-In Single-Out (MISO) vers un schéma Multiple-In Multiple-Out (MIMO). Ensuite, pour améliorer la précision de prédiction, un ensemble de données complet a été collecté à partir de diverses vidéos de matchs de badminton et étiqueté pour l’entraînement et le test. Cet ensemble comprend 55 563 images provenant de 18 vidéos de matchs de badminton. En outre, les mécanismes du réseau intègrent non seulement les couches VGG16 et d’upsampling, mais également une architecture U-Net. Enfin, pour réduire l’utilisation de la mémoire GPU, la structure des données de la couche de carte de chaleur a été révisée, passant d’un tableau 3D à codage one-hot par pixel à un tableau 2D à valeurs réelles. Afin de refléter ce changement de représentation de la carte de chaleur, la fonction de perte a été réconstruite, passant d’une fonction basée sur l’erreur quadratique moyenne (RMSE) à une fonction basée sur une entropie croisée pondérée. Une validation globale montre que les performances de TrackNetV2 atteignent respectivement 96,3 %, 97,0 % et 98,7 % en précision, exactitude et rappel lors de l’entraînement, et 85,2 %, 97,2 % et 85,4 % lors d’un test sur un match entièrement nouveau. La version TrackNetV2 à 3 entrées et 3 sorties atteint une vitesse de traitement de 31,84 FPS. L’ensemble de données et le code source de ce travail sont disponibles à l’adresse suivante : https://nol.cs.nctu.edu.tw:234/open-source/TrackNetv2/.

TrackNetV2 : Réseau efficace de suivi de volant | Articles de recherche récents | HyperAI