HyperAIHyperAI
vor 2 Monaten

Hohe-Auflösungs-Darstellungen für die Beschriftung von Pixeln und Regionen

Ke Sun; Yang Zhao; Borui Jiang; Tianheng Cheng; Bin Xiao; Dong Liu; Yadong Mu; Xinggang Wang; Wenyu Liu; Jingdong Wang
Hohe-Auflösungs-Darstellungen für die Beschriftung von Pixeln und Regionen
Abstract

Hochaufgelöste Repräsentationenlernen spielt eine wesentliche Rolle bei vielen visuellen Aufgaben, wie z.B. Pose-Schätzung und semantische Segmentierung. Das hochaufgelöste Netzwerk (HRNet)~\cite{SunXLW19}, das kürzlich für die Pose-Schätzung von Menschen entwickelt wurde, behält durch den gesamten Prozess hochaufgelöste Repräsentationen bei, indem es Hoch- auf Nieder-auflösende Faltungen \emph{parallel} verbindet und durch wiederholte Fusionen über parallele Faltungen starke hochaufgelöste Repräsentationen erzeugt.In dieser Arbeit führen wir eine weitere Untersuchung der hochaufgelösten Repräsentationen durch, indem wir eine einfache, aber effektive Modifikation einfügen und sie auf eine breite Palette von visuellen Aufgaben anwenden. Wir erweitern die hochaufgelöste Repräsentation, indem wir die (vergrößerten) Repräsentationen aus allen parallelen Faltungen aggregieren, anstatt nur die Repräsentation aus der hochaufgelösten Faltung zu verwenden, wie es in~\cite{SunXLW19} gemacht wird. Diese einfache Modifikation führt zu stärkeren Repräsentationen, was durch überlegene Ergebnisse belegt wird. Wir zeigen Spitzenergebnisse in der semantischen Segmentierung auf Cityscapes, LIP und PASCAL Context sowie bei der Gesichtspunkterkennung auf AFLW, COFW, $300$W und WFLW. Zudem bauen wir eine mehrstufige Repräsentation aus der hochaufgelösten Repräsentation auf und wenden sie sowohl auf das Faster R-CNN-Objekterkennungsframework als auch auf erweiterte Frameworks an. Der vorgeschlagene Ansatz erreicht überlegene Ergebnisse im Vergleich zu bestehenden Einzelmodellnetzwerken bei der Objekterkennung auf COCO. Der Code und die Modelle sind öffentlich verfügbar unter \url{https://github.com/HRNet}.

Hohe-Auflösungs-Darstellungen für die Beschriftung von Pixeln und Regionen | Neueste Forschungsarbeiten | HyperAI