HyperAIHyperAI

Command Palette

Search for a command to run...

vor 4 Monaten

TrackNetV2: Effizientes Shuttlecock-Verfolgungsnetzwerk

{Tsì-Uí İk Ho-Yi Chung Dung-Ru Yu Tzu-Han Hsu Shao-Ping Chuang Yu-Ching Lin Nien-En Sun}

Abstract

TrackNet, ein tiefes Lernnetzwerk, wurde vorgeschlagen, um hochgeschwindige und winzige Objekte wie Tennisbälle und Federbälle aus Videos zu verfolgen. Um Probleme niedriger Bildqualität – beispielsweise Unschärfe, Nachbilder und kurzfristige Verdeckung – zu bewältigen, werden mehrere aufeinanderfolgende Bilder gemeinsam als Eingabe verwendet, um ein fliegendes Objekt zu detektieren. In dieser Arbeit wird TrackNetV2 vorgestellt, um die Leistungsfähigkeit von TrackNet auf verschiedenen Ebenen zu verbessern, insbesondere hinsichtlich Verarbeitungsgeschwindigkeit, Vorhersagegenauigkeit und Nutzung des GPU-Speichers. Zunächst wird die Verarbeitungsgeschwindigkeit von 2,6 FPS auf 31,8 FPS erhöht. Dieser Leistungsfortschritt wird erreicht, indem die Eingabebildgröße verkleinert und das Netzwerkarchitektur von einer Multiple-In-Single-Out-(MISO)-Struktur auf eine Multiple-In-Multiple-Out-(MIMO)-Struktur umgestaltet wird. Um die Vorhersagegenauigkeit weiter zu steigern, wurde ein umfassender Datensatz aus diversen Badminton-Spielfilmen gesammelt und annotiert, um das Modell zu trainieren und zu testen. Der Datensatz umfasst 55.563 Frames aus 18 Badminton-Spielfilmen. Zudem basieren die Netzwerkmechanismen nicht nur auf VGG16 und Upsampling-Schichten, sondern auch auf der U-Net-Architektur. Schließlich wird der GPU-Speicherverbrauch reduziert, indem die Datenstruktur der Heatmap-Schicht von einem pixelbasierten One-Hot-Codierung-3D-Array auf ein reellwertiges 2D-Array umgestaltet wird. Um die Veränderung der Heatmap-Darstellung angemessen zu erfassen, wird die Verlustfunktion von einer RMSE-basierten auf eine gewichtete Kreuzentropie-basierte Funktion umgestellt. Eine umfassende Validierung zeigt, dass die Genauigkeit, Präzision und Recall von TrackNetV2 im Trainingsphase jeweils 96,3 %, 97,0 % und 98,7 % betragen, während sie im Test auf einem brandneuen Match 85,2 %, 97,2 % und 85,4 % erreichen. Die Verarbeitungsgeschwindigkeit der TrackNetV2-Version mit drei Eingaben und drei Ausgaben erreicht 31,84 FPS. Der Datensatz und der Quellcode dieser Arbeit sind unter https://nol.cs.nctu.edu.tw:234/open-source/TrackNetv2/ verfügbar.

Benchmarks

BenchmarkMethodikMetriken
sports-ball-detection-and-tracking-onTrackNetV2
Accuracy (%): 85.6
Average Precision (%): 83.6
F1 (%): 90.5
sports-ball-detection-and-tracking-on-1TrackNetV2
Accuracy (%): 73.8
Average Precision (%): 72.3
F1 (%): 83.6
sports-ball-detection-and-tracking-on-2TrackNetV2
Accuracy (%): 69.3
Average Precision (%): 64.6
F1 (%): 78.8
sports-ball-detection-and-tracking-on-sbdtTrackNetV2
Accuracy (% ): 97.7
Average Precision (%): 77.2
F1 (%): 86.6
sports-ball-detection-and-tracking-on-tennisTrackNetV2
Accuracy (%): 81.4
Average Precision (%): 80.6
F1 (%): 89.4

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
TrackNetV2: Effizientes Shuttlecock-Verfolgungsnetzwerk | Forschungsarbeiten | HyperAI