vor 6 Monaten

Zusammenfassung

Wir präsentieren einen Rahmen für die auf Aufmerksamkeit basierende Video-Objektdetektion, der einen einfachen, aber effektiven Algorithmus zur externen Speicherverwaltung nutzt. In der Aufgabe der Video-Objektdetektion wurde ein Aufmerksamkeitsmechanismus eingeführt, um die Merkmale von Schlüsselbildern durch Informationen aus benachbarten Bildern zu bereichern. Obwohl mehrere neuere Studien einen framebasierten First-In-First-Out (FIFO)-Speicher zur Erfassung globaler Videoinformationen verwenden, leidet diese Speicherstruktur unter ineffizienter Sammlung, was zu einer geringen Aufmerksamkeitsleistung und hohem Rechenaufwand führt. Um dieses Problem zu lösen, entwickeln wir ein neuartiges Verfahren namens „Diversity-aware Feature Aggregation“ (DAFA). Im Gegensatz zu anderen Ansätzen, die ohne Erweiterung der Speicherkapazität nicht ausreichend Merkmalsinformationen speichern können, sammelt DAFA effizient vielfältige Merkmale und vermeidet gleichzeitig Redundanz mittels einer einfachen Metrik basierend auf euklidischer Distanz. Experimentelle Ergebnisse auf dem ImageNet VID-Datensatz zeigen, dass unser leichtgewichtiges Modell mit globaler Aufmerksamkeit eine mAP von 83,5 bei Verwendung eines ResNet-101-Backbones erreicht, was die Genauigkeit der meisten bestehenden Methoden übertrifft und gleichzeitig einen minimalen Laufzeitbedarf aufweist. Unser Ansatz mit globalen und lokalen Aufmerksamkeitsstufen erreicht jeweils 84,5 mAP (ResNet-101) und 85,9 mAP (ResNeXt-101), wodurch eine state-of-the-art-Leistung erzielt wird, ohne zusätzliche Nachverarbeitungsmethoden zu erfordern.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 6 Monaten

Ki-Seok Chung Si-Dong Roh

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 6 Monaten

Ki-Seok Chung Si-Dong Roh

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

DAFA: Diversity-Aware Feature Aggregation für attentionbasierte Video-Objekterkennung | Paper | HyperAI

Command Palette

DAFA: Diversity-Aware Feature Aggregation für attentionbasierte Video-Objekterkennung

Ki-Seok Chung Si-Dong Roh

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

DAFA: Diversity-Aware Feature Aggregation für attentionbasierte Video-Objekterkennung

Ki-Seok Chung Si-Dong Roh

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

DAFA: Diversity-Aware Feature Aggregation für attentionbasierte Video-Objekterkennung

Ki-Seok Chung Si-Dong Roh

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters