vor 6 Monaten

Zusammenfassung

Die Objektdetektion in Videos ist herausfordernd, wenn bestimmte Videoframes eine Verschlechterung der Erscheinungsqualität aufweisen. Daher ist es naheliegend, zeitliche Informationen aus anderen Frames des gleichen Videos in den aktuellen Frame zu integrieren. Allerdings bleibt RoI Align, einer der zentralen Bausteine von Video-Detektoren, weiterhin darauf beschränkt, Merkmale aus einer einzigen Frame-Merkmalskarte für Vorschläge zu extrahieren, wodurch die abgerufenen RoI-Merkmale zeitliche Informationen aus dem Video vermissen. In dieser Arbeit wird ein neuartiger Temporal RoI Align-Operator vorgestellt, der unter Berücksichtigung der hohen Ähnlichkeit der Merkmale derselben Objektinstanz über mehrere Frames hinweg Merkmale aus den Merkmalskarten anderer Frames für die Vorschläge des aktuellen Frames mithilfe von Merkmalsimilarität extrahiert. Der vorgeschlagene Temporal RoI Align-Operator ermöglicht es, zeitliche Informationen aus dem gesamten Video für die Vorschläge zu gewinnen. Wir integrieren ihn in Einzelbild-Video-Detektoren sowie in andere state-of-the-art-Video-Detektoren und führen quantitative Experimente durch, die belegen, dass der vorgeschlagene Temporal RoI Align-Operator die Leistung konsistent und signifikant verbessert. Zudem lässt sich der vorgeschlagene Temporal RoI Align-Operator auch auf die Video-Instanzsegmentierung anwenden. Der Quellcode ist unter https://github.com/open-mmlab/mmtracking verfügbar.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 6 Monaten

Tao Gong Kai Chen Xinjiang Wang Qi Chu Feng Zhu Dahua Lin Nenghai Yu Huamin Feng

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 6 Monaten

Tao Gong Kai Chen Xinjiang Wang Qi Chu Feng Zhu Dahua Lin Nenghai Yu Huamin Feng

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Temporale RoI-Align für die Video-Objekterkennung | Paper | HyperAI

Command Palette

Temporale RoI-Align für die Video-Objekterkennung

Tao Gong Kai Chen Xinjiang Wang Qi Chu Feng Zhu Dahua Lin Nenghai Yu Huamin Feng

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Temporale RoI-Align für die Video-Objekterkennung

Tao Gong Kai Chen Xinjiang Wang Qi Chu Feng Zhu Dahua Lin Nenghai Yu Huamin Feng

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Temporale RoI-Align für die Video-Objekterkennung

Tao Gong Kai Chen Xinjiang Wang Qi Chu Feng Zhu Dahua Lin Nenghai Yu Huamin Feng

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters