EMNIST: Eine Erweiterung von MNIST zu handschriftlichen Buchstaben

Der MNIST-Datensatz ist zu einem Standard-Referenzpunkt für Lern-, Klassifikations- und Computer Vision-Systeme geworden. Zu seiner weit verbreiteten Akzeptanz haben die verständliche und intuitive Natur der Aufgabe, seine relativ kleine Größe und Speicheranforderungen sowie die Zugänglichkeit und Benutzerfreundlichkeit des Datensatzes selbst beigetragen. Der MNIST-Datensatz wurde aus einem größeren Datensatz abgeleitet, bekannt als das NIST Special Database 19, der Ziffern, Groß- und Kleinbuchstaben von handschriftlichen Buchstaben enthält. In dieser Arbeit wird eine Variante des vollständigen NIST-Datensatzes vorgestellt, die wir als Extended MNIST (EMNIST) bezeichnen, welche dasselbe Konvertierungsparadigma verwendet, das zum Erstellen des MNIST-Datensatzes angewendet wurde. Das Ergebnis ist eine Reihe von Datensätzen, die anspruchsvollere Klassifikationsaufgaben mit Buchstaben und Ziffern darstellen und dieselbe Bildstruktur und Parameter wie die ursprüngliche MNIST-Aufgabe teilen, wodurch eine direkte Kompatibilität mit allen existierenden Klassifikatoren und Systemen gewährleistet ist. Benchmark-Ergebnisse werden präsentiert sowie eine Validierung des Konvertierungsprozesses durch den Vergleich der Klassifikationsergebnisse auf konvertierten NIST-Ziffern und den MNIST-Ziffern.