Gruppenkooperatives Lernen für die Erkennung von ko-salienten Objekten

Wir präsentieren ein neues Gruppen-kollaboratives Lernframework (GCoNet), das in der Lage ist, ko-saliente Objekte in Echtzeit (16 ms) zu erkennen, indem es gleichzeitig konsensuelle Repräsentationen auf Gruppenebene basierend auf den beiden notwendigen Kriterien abgräbt:1) Intra-Gruppen-Kompaktheit, um die Konsistenz zwischen ko-salienten Objekten besser zu formulieren, indem ihre inhärenten gemeinsamen Attribute durch unser neuartiges Gruppenaffinitätmodul erfasst werden;2) Inter-Gruppen-Trennbarkeit, um den Einfluss von störenden Objekten auf die Ausgabe effektiv zu unterdrücken, indem unser neues Gruppenkollaborationsmodul die inkonsistenten Konsensreihenfolgen beeinflusst.Um einen besseren Einbettungsraum ohne zusätzlichen Rechenaufwand zu lernen, verwenden wir explizit eine Hilfsklassifikationssupervision. Umfangreiche Experimente an drei anspruchsvollen Benchmarks, nämlich CoCA, CoSOD3k und Cosal2015, zeigen, dass unser einfaches GCoNet 10 state-of-the-art Modelle übertrifft und den neuen Stand der Technik erreicht. Wir demonstrieren die neuen technischen Beiträge dieses Papers anhand einer Reihe wichtiger nachgeschalteter Anwendungen im Bereich der Computer Vision, einschließlich inhaltsbasierter Ko-Segmentierung und automatischer Thumbnails basierend auf Ko-Lokalisierung usw.