HyperAIHyperAI
vor 17 Tagen

Die MAMe-Datenbank: Zur Relevanz von hochaufgelösten und variabel geformten Bilddaten

Ferran Parés, Anna Arias-Duart, Dario Garcia-Gasulla, Gema Campo-Francés, Nina Viladrich, Eduard Ayguadé, Jesús Labarta
Die MAMe-Datenbank: Zur Relevanz von hochaufgelösten und variabel geformten Bilddaten
Abstract

Bei der Bildklassifizierung ist die üblichste Vorgehensweise, alle Bilder einer Datensammlung auf eine einheitliche Form zu skalieren und gleichzeitig ihre Genauigkeit auf ein Maß zu reduzieren, das die Durchführung von Experimenten im großen Maßstab erleichtert. Diese Praxis bietet Vorteile aus rechnerischer Sicht, hat jedoch negative Auswirkungen auf die Leistungsfähigkeit, da Informationen verloren gehen und die Bilder verzerrt werden. In dieser Arbeit stellen wir die MAMe-Datensammlung vor, eine Datensammlung für die Bildklassifizierung mit bemerkenswert hoher Auflösung und variabler Bildform. Ziel von MAMe ist es, ein Werkzeug bereitzustellen, um den Einfluss dieser Eigenschaften auf die Bildklassifizierung zu untersuchen und gleichzeitig die Forschung in diesem Bereich zu fördern. Die MAMe-Datensammlung enthält Tausende von Kunstwerken aus drei verschiedenen Museen und schlägt eine Klassifizierungsaufgabe vor, bei der 29 verschiedene Medien (d. h. Materialien und Techniken) unter Anleitung von Kunstsachverständigen unterschieden werden sollen. Nach einer Analyse der Besonderheiten von MAMe im Kontext aktueller Bildklassifizierungsaufgaben wird die Aufgabe ausführlich beschrieben sowie eine detaillierte Statistik der Datensammlung präsentiert. Experimente werden durchgeführt, um den Einfluss der Verwendung hochaufgelöster Bilder, variabler Eingabebilder und beider Eigenschaften gleichzeitig zu bewerten. Die Ergebnisse zeigen einen positiven Einfluss auf die Leistungsfähigkeit bei Verwendung hochaufgelöster Bilder, verdeutlichen jedoch gleichzeitig die fehlende Verfügbarkeit effektiver Lösungen zur Nutzung variabler Bildformen. Ein zusätzlicher Experimentteil macht die Unterschiedlichkeit zwischen der MAMe-Datensammlung und der prototypischen ImageNet-Datensammlung deutlich. Schließlich werden die Baseline-Modelle mithilfe von Erklärbarkeitsmethoden und fachkundiger Expertise analysiert, um Einblicke in die noch bestehenden Herausforderungen zu gewinnen.