HyperAIHyperAI
vor 2 Monaten

Min-Entropie-Latentes Modell für schwach überwachte Objekterkennung

Fang Wan; Pengxu Wei; Zhenjun Han; Jianbin Jiao; Qixiang Ye
Min-Entropie-Latentes Modell für schwach überwachte Objekterkennung
Abstract

Schwach überwachte Objekterkennung ist eine herausfordernde Aufgabe, wenn nur die Kategorieüberwachung von Bildern zur Verfügung steht, aber gleichzeitig die Positionen der Objekte und Objekterkennungsmodelle gelernt werden müssen. Die Inkonsistenz zwischen der schwachen Überwachung und den Lernzielen führt zu erheblicher Zufälligkeit in den Objektpositionen und zu Unsicherheiten bei den Detektoren. In dieser Arbeit wird ein Modell mit minimaler Entropie für latente Variablen (Min-Entropy Latent Model, MELM) für schwach überwachte Objekterkennung vorgeschlagen. Die Min-Entropie dient als Modell zur Lernung von Objektpositionen und als Metrik zur Messung der Zufälligkeit der Objektlokalisation während des Lernprozesses. Ziel ist es, die Varianz der gelernten Instanzen grundsätzlich zu reduzieren und die Unsicherheiten der Detektoren zu lindern. Das MELM wird in drei Komponenten unterteilt: Vorschlag-Clusterteilung, Objektclusternerfassung und Objektlokalisation. Es wird mit einem rekurrenten Lernalgorithmus optimiert, der kontinuierliche Optimierung nutzt, um das anspruchsvolle Problem der Nichtkonvexität zu lösen. Experimente zeigen, dass das MELM die Leistung von schwach überwachten Objekterkennung, schwach überwachter Objektlokalisation und Bildklassifizierung gegenüber den neuesten Ansätzen erheblich verbessert.

Min-Entropie-Latentes Modell für schwach überwachte Objekterkennung | Neueste Forschungsarbeiten | HyperAI