HyperAIHyperAI

Command Palette

Search for a command to run...

vor 4 Monaten

Deep Multi-Patch Aggregation Network für die Bildstil-, Ästhetik- und Qualitätsbewertung

{Radomir Mech Xin Lu Xiaohui Shen Zhe Lin James Z. Wang}

Deep Multi-Patch Aggregation Network für die Bildstil-, Ästhetik- und Qualitätsbewertung

Abstract

Diese Arbeit untersucht Probleme der Bildstil-, Ästhetik- und Qualitätsbewertung, die feinabgestimmte Details aus hochauflösenden Bildern erfordern, und nutzt hierfür einen Ansatz des Trainings tiefgelegener neuronalen Netze. Bestehende tiefe konvolutionale neuronale Netze extrahieren in der Regel lediglich einen einzelnen Patch – beispielsweise eine verkleinerte Ausschnittsauswahl – aus jedem Bild als Trainingsbeispiel. Ein solcher Patch kann jedoch nicht immer eine vollständige Repräsentation des gesamten Bildes liefern, was während des Trainings zu Unsicherheiten führen kann. Wir schlagen einen neuen Ansatz des Trainings eines tiefen Multi-Patch-Aggregationsnetzwerks vor, der es ermöglicht, Modelle mit mehreren aus einem einzigen Bild generierten Patch-Teilen zu trainieren. Dies erreichen wir durch die Konstruktion mehrerer gemeinsam genutzter Spalten im neuronalen Netzwerk, denen jeweils mehrere Patch-Teile zugeführt werden. Vor allem stellen wir zwei neuartige Netzwerkschichten vor – eine Statistik-Schicht und eine Sortier-Schicht –, die die Aggregation dieser Patch-Teile unterstützen. Das vorgeschlagene tiefe Multi-Patch-Aggregationsnetzwerk integriert gemeinsame Merkmalslernprozesse und Funktionslernprozesse für die Aggregation in einem einheitlichen Rahmen. Wir belegen die Wirksamkeit des vorgeschlagenen Netzwerks anhand der drei Anwendungen: Bildstilerkennung, Kategorisierung der ästhetischen Qualität und Bildqualitätsschätzung. Die von uns mit den vorgeschlagenen Netzwerken trainierten Modelle übertrumpfen in allen drei Anwendungen signifikant die bisherigen State-of-the-Art-Methoden.

Benchmarks

BenchmarkMethodikMetriken
aesthetics-quality-assessment-on-avaDMA-Net
Accuracy: 75.4%

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Deep Multi-Patch Aggregation Network für die Bildstil-, Ästhetik- und Qualitätsbewertung | Forschungsarbeiten | HyperAI