HyperAIHyperAI

Command Palette

Search for a command to run...

vor 4 Monaten

Szenenparsung mittels integriertem Klassifizierungsmodell und varianzbasierter Regularisierung

{ Zichen Song Qingbo Wu Hongliang Li Hengcan Shi}

Szenenparsung mittels integriertem Klassifizierungsmodell und varianzbasierter Regularisierung

Abstract

Die Szenenparsung ist eine herausfordernde Aufgabe im Bereich des Computersehens und kann als ein pixelweise Klassifikationsproblem formuliert werden. Bisherige auf tiefen Lernverfahren basierende Ansätze verwenden gewöhnlich einen allgemeinen Klassifikator, um alle Objektkategorien zu erkennen. Allerdings neigt dieser allgemeine Klassifikator dazu, bei der Unterscheidung von verwirrenden Kategorien, die sich in Erscheinungsbild oder Semantik ähneln, leicht Fehler zu machen. In diesem Artikel stellen wir ein integriertes Klassifikationsmodell sowie eine varianzbasierte Regularisierung vor, um präzisere Klassifikationen zu erreichen. Einerseits umfasst das integrierte Klassifikationsmodell mehrere Klassifikatoren – nicht nur den allgemeinen Klassifikator, sondern auch einen Verfeinerungsklassifikator, der besonders auf die Unterscheidung verwirrender Kategorien ausgerichtet ist. Andererseits sorgt die varianzbasierte Regularisierung dafür, dass die Scores aller Kategorien so unterschiedlich wie möglich werden, um Fehlklassifikationen zu reduzieren. Konkret umfasst das integrierte Klassifikationsmodell drei Schritte: Der erste Schritt besteht in der Extraktion der Merkmale jedes Pixels. Auf Basis dieser Merkmale erfolgt im zweiten Schritt die Klassifikation jedes Pixels über alle Kategorien, um ein vorläufiges Klassifikationsergebnis zu generieren. Im dritten Schritt nutzen wir einen Verfeinerungsklassifikator, um das vorläufige Ergebnis zu verbessern, wobei der Fokus auf der Unterscheidung von Kategorien mit hohen vorläufigen Scores liegt. Zur Trainingsphase wird eine integrierte Verlustfunktion eingesetzt, die die varianzbasierte Regularisierung beinhaltet. Umfassende Experimente an drei gängigen Datensätzen für Szenenparsung belegen die Wirksamkeit des vorgeschlagenen Ansatzes.

Benchmarks

BenchmarkMethodikMetriken
scene-segmentation-on-sun-rgbdICM
Mean IoU: 50.60
semantic-segmentation-on-nyu-depth-v2ICM
Mean IoU: 50.70
semantic-segmentation-on-pascal-contextICM
mIoU: 52.60

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Szenenparsung mittels integriertem Klassifizierungsmodell und varianzbasierter Regularisierung | Forschungsarbeiten | HyperAI