HyperAIHyperAI
vor 2 Monaten

Zickzack-Lernen für schwach überwachte Objekterkennung

Xiaopeng Zhang; Jiashi Feng; Hongkai Xiong; Qi Tian
Zickzack-Lernen für schwach überwachte Objekterkennung
Abstract

Dieses Papier behandelt die schwach überwachte Objekterkennung unter Verwendung von nur bildbasierten Annotationen im Trainingsprozess. Frühere Ansätze trainieren Erkennungsmodelle mit gesamten Bildern auf einmal, was dazu führt, dass die Modelle aufgrund der eingeführten Falschpositiven leicht in Unteroptima geraten. Im Gegensatz dazu schlagen wir eine Zickzack-Lernstrategie vor, um gleichzeitig verlässliche Objektinstanzen zu entdecken und das Modell vom Überfitting anfänglicher Samen zu bewahren. Um dieses Ziel zu erreichen, entwickeln wir zunächst ein Kriterium namens mittlere Energieakkumulationsscores (mEAS), um die Lokalisierungsschwierigkeit eines Bildes, das das Zielobjekt enthält, automatisch zu messen und zu bewerten. Anschließend lernen wir den Detektor schrittweise durch die Aufnahme von Beispielen mit steigender Schwierigkeit. Auf diese Weise kann das Modell durch das Training an einfachen Beispielen gut vorbereitet werden, um aus schwierigeren Beispielen zu lernen und somit seine Erkennungsfähigkeit effizienter zu verbessern. Darüber hinaus führen wir eine neuartige Maskierungsregularisierungsstrategie für die hochstufigen Faltungsmerkmalskarten ein, um das Überfitting anfänglicher Stichproben zu vermeiden. Diese beiden Module bilden einen Zickzack-Lernprozess, bei dem fortschreitendes Lernen darauf abzielt, verlässliche Objektinstanzen zu entdecken, während die Maskierungsregularisierung die Schwierigkeit des ordnungsgemäßen Auffindens von Objektinstanzen erhöht. Wir erzielen 47,6 % mAP auf PASCAL VOC 2007 und übertreffen damit den aktuellen Stand der Technik deutlich.

Zickzack-Lernen für schwach überwachte Objekterkennung | Neueste Forschungsarbeiten | HyperAI