HyperAIHyperAI
vor 12 Tagen

Szenenparsung mittels integriertem Klassifizierungsmodell und varianzbasierter Regularisierung

{ Zichen Song, Qingbo Wu, Hongliang Li, Hengcan Shi}
Szenenparsung mittels integriertem Klassifizierungsmodell und varianzbasierter Regularisierung
Abstract

Die Szenenparsung ist eine herausfordernde Aufgabe im Bereich des Computersehens und kann als ein pixelweise Klassifikationsproblem formuliert werden. Bisherige auf tiefen Lernverfahren basierende Ansätze verwenden gewöhnlich einen allgemeinen Klassifikator, um alle Objektkategorien zu erkennen. Allerdings neigt dieser allgemeine Klassifikator dazu, bei der Unterscheidung von verwirrenden Kategorien, die sich in Erscheinungsbild oder Semantik ähneln, leicht Fehler zu machen. In diesem Artikel stellen wir ein integriertes Klassifikationsmodell sowie eine varianzbasierte Regularisierung vor, um präzisere Klassifikationen zu erreichen. Einerseits umfasst das integrierte Klassifikationsmodell mehrere Klassifikatoren – nicht nur den allgemeinen Klassifikator, sondern auch einen Verfeinerungsklassifikator, der besonders auf die Unterscheidung verwirrender Kategorien ausgerichtet ist. Andererseits sorgt die varianzbasierte Regularisierung dafür, dass die Scores aller Kategorien so unterschiedlich wie möglich werden, um Fehlklassifikationen zu reduzieren. Konkret umfasst das integrierte Klassifikationsmodell drei Schritte: Der erste Schritt besteht in der Extraktion der Merkmale jedes Pixels. Auf Basis dieser Merkmale erfolgt im zweiten Schritt die Klassifikation jedes Pixels über alle Kategorien, um ein vorläufiges Klassifikationsergebnis zu generieren. Im dritten Schritt nutzen wir einen Verfeinerungsklassifikator, um das vorläufige Ergebnis zu verbessern, wobei der Fokus auf der Unterscheidung von Kategorien mit hohen vorläufigen Scores liegt. Zur Trainingsphase wird eine integrierte Verlustfunktion eingesetzt, die die varianzbasierte Regularisierung beinhaltet. Umfassende Experimente an drei gängigen Datensätzen für Szenenparsung belegen die Wirksamkeit des vorgeschlagenen Ansatzes.

Szenenparsung mittels integriertem Klassifizierungsmodell und varianzbasierter Regularisierung | Neueste Forschungsarbeiten | HyperAI