HyperAIHyperAI

Command Palette

Search for a command to run...

Die MAMe-Datenbank: Zur Relevanz von hochaufgelösten und variabel geformten Bilddaten

Ferran Parés Anna Arias-Duart Dario Garcia-Gasulla Gema Campo-Francés Nina Viladrich Eduard Ayguadé Jesús Labarta

Zusammenfassung

Bei der Bildklassifizierung ist die üblichste Vorgehensweise, alle Bilder einer Datensammlung auf eine einheitliche Form zu skalieren und gleichzeitig ihre Genauigkeit auf ein Maß zu reduzieren, das die Durchführung von Experimenten im großen Maßstab erleichtert. Diese Praxis bietet Vorteile aus rechnerischer Sicht, hat jedoch negative Auswirkungen auf die Leistungsfähigkeit, da Informationen verloren gehen und die Bilder verzerrt werden. In dieser Arbeit stellen wir die MAMe-Datensammlung vor, eine Datensammlung für die Bildklassifizierung mit bemerkenswert hoher Auflösung und variabler Bildform. Ziel von MAMe ist es, ein Werkzeug bereitzustellen, um den Einfluss dieser Eigenschaften auf die Bildklassifizierung zu untersuchen und gleichzeitig die Forschung in diesem Bereich zu fördern. Die MAMe-Datensammlung enthält Tausende von Kunstwerken aus drei verschiedenen Museen und schlägt eine Klassifizierungsaufgabe vor, bei der 29 verschiedene Medien (d. h. Materialien und Techniken) unter Anleitung von Kunstsachverständigen unterschieden werden sollen. Nach einer Analyse der Besonderheiten von MAMe im Kontext aktueller Bildklassifizierungsaufgaben wird die Aufgabe ausführlich beschrieben sowie eine detaillierte Statistik der Datensammlung präsentiert. Experimente werden durchgeführt, um den Einfluss der Verwendung hochaufgelöster Bilder, variabler Eingabebilder und beider Eigenschaften gleichzeitig zu bewerten. Die Ergebnisse zeigen einen positiven Einfluss auf die Leistungsfähigkeit bei Verwendung hochaufgelöster Bilder, verdeutlichen jedoch gleichzeitig die fehlende Verfügbarkeit effektiver Lösungen zur Nutzung variabler Bildformen. Ein zusätzlicher Experimentteil macht die Unterschiedlichkeit zwischen der MAMe-Datensammlung und der prototypischen ImageNet-Datensammlung deutlich. Schließlich werden die Baseline-Modelle mithilfe von Erklärbarkeitsmethoden und fachkundiger Expertise analysiert, um Einblicke in die noch bestehenden Herausforderungen zu gewinnen.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp