vor 8 Monaten

Zusammenfassung

In dieser Arbeit schlagen wir ein von Anfang bis Ende trainierbares tiefes neuronales Netzwerkmodell für die Erkennung egozentrischer Aktivitäten vor. Unser Modell basiert auf der Beobachtung, dass egozentrische Aktivitäten stark durch die Objekte und ihre Positionen im Video charakterisiert sind. Auf dieser Grundlage entwickeln wir einen räumlichen Aufmerksamkeitsmechanismus, der es dem Netzwerk ermöglicht, sich auf Bereiche zu konzentrieren, die Objekte enthalten, die mit der betrachteten Aktivität korreliert sind. Wir lernen hochspezialisierte Aufmerksamkeitskarten für jedes Bild unter Verwendung klassenspezifischer Aktivierungen aus einem CNN (Convolutional Neural Network), das für die generische Bilderkennung vortrainiert wurde, und verwenden diese Karten zur raumzeitlichen Kodierung des Videos mit einem konvolutionellen LSTM (Long Short-Term Memory). Unser Modell wird in einer schwach überwachten Umgebung unter Verwendung roher videobasierter Aktivitätsklassenlabels trainiert. Trotzdem übertreffen unsere Ergebnisse auf standardisierten Benchmarks für egozentrische Aktivitäten die der momentan besten Methode, die starke Überwachung durch manuelle Segmentierung und Objektlokalisierung nutzt, um bis zu 6 Prozentpunkte in der Erkennungspräzision. Wir führen eine visuelle Analyse der vom Netzwerk generierten Aufmerksamkeitskarten durch, die zeigt, dass das Netzwerk erfolgreich die relevanten Objekte in den Videobildern identifiziert, was möglicherweise die starke Erkennungsleistung erklärt. Darüber hinaus diskutieren wir eine umfassende Ablationsanalyse bezüglich der Designentscheidungen.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 8 Monaten

Aktionserkennung

Faltungsneuronales Netzwerk

Swathi Kiran Sudhakaran Oswald Lanz

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 8 Monaten

Aktionserkennung

Faltungsneuronales Netzwerk

Swathi Kiran Sudhakaran Oswald Lanz

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Aufmerksamkeit ist alles, was wir brauchen: Die Fokussierung auf objektorientierte Aufmerksamkeit für die Erkennung egozentrischer Aktivitäten | Paper | HyperAI

Command Palette

Aufmerksamkeit ist alles, was wir brauchen: Die Fokussierung auf objektorientierte Aufmerksamkeit für die Erkennung egozentrischer Aktivitäten

Swathi Kiran Sudhakaran Oswald Lanz

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Aufmerksamkeit ist alles, was wir brauchen: Die Fokussierung auf objektorientierte Aufmerksamkeit für die Erkennung egozentrischer Aktivitäten

Swathi Kiran Sudhakaran Oswald Lanz

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Aufmerksamkeit ist alles, was wir brauchen: Die Fokussierung auf objektorientierte Aufmerksamkeit für die Erkennung egozentrischer Aktivitäten

Swathi Kiran Sudhakaran Oswald Lanz

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters