HyperAI

Abstract

Neuere Studien haben gezeigt, dass die Berücksichtigung von Kontextinformationen aus Vorschlägen in verschiedenen Frames die Leistung von Video-Objekterkennung deutlich verbessern kann. Allerdings nutzen diese Ansätze hauptsächlich die innerhalb einzelner Videos bestehenden Beziehungen zwischen Vorschlägen, während sie die innerhalb von verschiedenen Videos bestehenden Beziehungen zwischen Vorschlägen vernachlässigen, welche wichtige diskriminative Hinweise für die Erkennung verwirrender Objekte liefern können. Um diesen Limitierung zu begegnen, schlagen wir einen neuen Inter-Video-Vorschlag-Beziehung-Modul (Inter-Video Proposal Relation Module) vor. Auf Basis eines kompakten mehrstufigen Dreier-Selektionsansatzes kann dieser Modul effektive Objektrepräsentationen durch Modellierung der Beziehungen zwischen anspruchsvollen Vorschlägen aus verschiedenen Videos erlernen. Darüber hinaus entwerfen wir ein hierarchisches Video-Beziehungsnetzwerk (Hierarchical Video Relation Network, HVR-Net), indem wir innerhalb- und zwischen-Video-Vorschlagsbeziehungen hierarchisch integrieren. Diese Architektur ermöglicht es, schrittweise sowohl intra- als auch inter-Video-Kontextinformationen auszunutzen, um die Video-Objekterkennung zu verbessern. Wir evaluieren unsere Methode am großen Video-Objekterkennungsbenchmark ImageNet VID, wo HVR-Net SOTA-Ergebnisse erzielt. Die Codes und Modelle werden anschließend veröffentlicht.

Benchmark	Methodik	Metriken
video-object-detection-on-imagenet-vid	HVRNet (ResNeXt101-32x4d)	MAP : 85.5
video-object-detection-on-imagenet-vid	HVRNet (ResNest101)	MAP : 83.8

Benchmark

Methodik

Metriken

video-object-detection-on-imagenet-vid

HVRNet (ResNeXt101-32x4d)

MAP : 85.5

video-object-detection-on-imagenet-vid

HVRNet (ResNest101)

MAP : 83.8

Abstract

Benchmark	Methodik	Metriken
video-object-detection-on-imagenet-vid	HVRNet (ResNeXt101-32x4d)	MAP : 85.5
video-object-detection-on-imagenet-vid	HVRNet (ResNest101)	MAP : 83.8

Benchmark

Methodik

Metriken

video-object-detection-on-imagenet-vid

HVRNet (ResNeXt101-32x4d)

MAP : 85.5

video-object-detection-on-imagenet-vid

HVRNet (ResNest101)

MAP : 83.8

Extraktion von Inter-Video-Vorschlags-Beziehungen für die Video-Objektdetektion

{Xiaojun Chang Yu Qiao Yali Wang Mingfei Han}

Abstract

Code-Repositories

Benchmarks

KI mit KI entwickeln

Hyper Newsletters

Extraktion von Inter-Video-Vorschlags-Beziehungen für die Video-Objektdetektion

{Xiaojun Chang Yu Qiao Yali Wang Mingfei Han}

Abstract

Code-Repositories

Benchmarks

KI mit KI entwickeln

Hyper Newsletters

Command Palette

Extraktion von Inter-Video-Vorschlags-Beziehungen für die Video-Objektdetektion

{Xiaojun Chang Yu Qiao Yali Wang Mingfei Han}

Abstract

Code-Repositories

Benchmarks

KI mit KI entwickeln

Hyper Newsletters

Command Palette

Extraktion von Inter-Video-Vorschlags-Beziehungen für die Video-Objektdetektion

{Xiaojun Chang Yu Qiao Yali Wang Mingfei Han}

Abstract

Code-Repositories

Benchmarks

KI mit KI entwickeln

Hyper Newsletters