HyperAIHyperAI

Command Palette

Search for a command to run...

FOSNet: Ein von Ende zu Ende trainierbares tiefes neuronales Netzwerk für die Szenerkennung

Hongje Seong Junhyuk Hyun Euntai Kim

Zusammenfassung

Szenerkennung ist ein Bilderkennungsproblem, das darauf abzielt, die Kategorie des Ortes vorherzusagen, an dem das Bild aufgenommen wurde. In dieser Arbeit wird eine neue Szenerkennungsmethode vorgeschlagen, die auf einem konvolutionellen Neuronalen Netz (CNN) basiert. Die vorgeschlagene Methode beruht auf der Fusion von Objekt- und Szeneinformationen im gegebenen Bild, und das CNN-Framework wird als FOS (Fusion of Object and Scene) Net bezeichnet. Darüber hinaus wurde ein neuer Verlustfunktion namens Szinkohärenzverlust (SCL) entwickelt, um das FOSNet zu trainieren und die Leistung der Szenerkennung zu verbessern. Der vorgeschlagene SCL basiert auf den einzigartigen Merkmalen der Szene, dass die "Szenerie" sich ausbreitet und die Szeneklasse über das gesamte Bild hinweg nicht ändert. Das vorgeschlagene FOSNet wurde mit drei der beliebtesten Szenerkennungsdatasets getestet und erzielte in zwei Datasets den aktuellen Stand der Technik: 60,14 % bei Places 2 und 90,37 % bei MIT Indoor 67. Die zweitbeste Leistung von 77,28 % wurde bei SUN 397 erreicht.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
FOSNet: Ein von Ende zu Ende trainierbares tiefes neuronales Netzwerk für die Szenerkennung | Paper | HyperAI