HyperAIHyperAI
vor 11 Tagen

Instanzbewusste, kontextfokussierte und speichereffiziente schwach überwachte Objekterkennung

Zhongzheng Ren, Zhiding Yu, Xiaodong Yang, Ming-Yu Liu, Yong Jae Lee, Alexander G. Schwing, Jan Kautz
Instanzbewusste, kontextfokussierte und speichereffiziente schwach überwachte Objekterkennung
Abstract

Schwach überwachtes Lernen ist als vielversprechendes Werkzeug für die Objektdetektion hervorgetreten, da es den Bedarf an starker Überwachung während des Trainings verringert. Dennoch bestehen erhebliche Herausforderungen: (1) Die Unterscheidung zwischen Objektinstanzen kann mehrdeutig sein; (2) Detektoren neigen dazu, sich auf diskriminative Teile zu konzentrieren, anstatt ganze Objekte zu erfassen; (3) Ohne Ground-Truth müssen Objektvorschläge redundante sein, um hohe Recall-Raten zu erreichen, was erheblichen Speicherverbrauch verursacht. Die Bewältigung dieser Herausforderungen ist schwierig, da oft Unsicherheiten und triviale Lösungen eliminiert werden müssen. Um diese Probleme anzugehen, entwickeln wir einen einheitlichen Rahmen, der instanzbewusst und kontextorientiert ist. Er nutzt einen instanzbewussten Selbst-Training-Algorithmus sowie einen lernbaren Concrete DropBlock und implementiert eine speichereffiziente sequenzielle Batch-Backpropagation. Unsere vorgeschlagene Methode erreicht Spitzenleistungen auf COCO ($12,1\% ~AP$, $24,8\% ~AP_{50}$), VOC 2007 ($54,9\% ~AP$) und VOC 2012 ($52,1\% ~AP$), wobei die Baselines erheblich übertroffen werden. Darüber hinaus ist die vorgeschlagene Methode die erste, die ResNet-basierte Modelle sowie schwach überwachte Video-Objektdetektion benchmarkt. Der Quellcode, die Modelle und weitere Details werden unter: https://github.com/NVlabs/wetectron bereitgestellt.

Instanzbewusste, kontextfokussierte und speichereffiziente schwach überwachte Objekterkennung | Neueste Forschungsarbeiten | HyperAI