Verbesserte effiziente Kapselfolie-Netzwerk für die Klassifikation des Kuzushiji-MNIST-Benchmark-Datensatzes
In diesem Paper präsentieren wir ein verbessertes effizientes Kapselnetzwerk (CapsNet)-Modell zur Klassifikation der Benchmark-Datensätze Kuzushiji-MNIST und Kuzushiji-49. Kapselnetzwerke stellen einen vielversprechenden Ansatz im Bereich des tiefen Lernens dar und bieten Vorteile wie Robustheit, bessere Generalisierungsfähigkeit sowie eine einfachere Netzwerkarchitektur im Vergleich zu herkömmlichen Faltungsneuralen Netzen (CNNs). Das vorgeschlagene Modell basiert auf der Efficient CapsNet-Architektur und integriert die Selbst-Attention-Routing-Mechanismus, was zu einer verbesserten Effizienz und einer reduzierten Anzahl an Parametern führt. Die durchgeführten Experimente an den Datensätzen Kuzushiji-MNIST und Kuzushiji-49 zeigen, dass das Modell eine konkurrenzfähige Leistung erzielt und sich innerhalb der Top-Ten-Lösungen für beide Benchmarks befindet. Trotz einer signifikant geringeren Anzahl an Parametern im Vergleich zu den hochbewerteten Konkurrenten erreicht das vorgestellte Modell vergleichbare Genauigkeit, wobei die Gesamtdifferenzen für Kuzushiji-MNIST und Kuzushiji-49 jeweils nur 0,91 % und 1,97 % betragen. Zudem ist die benötigte Trainingszeit erheblich reduziert, was eine Trainingsdurchführung auf nicht spezialisierten Workstations ermöglicht. Die vorgestellten Neuerungen der Kapselarchitektur – insbesondere die Integration des Selbst-Attention-Mechanismus und die effiziente Netzwerkstruktur – tragen maßgeblich zur verbesserten Effizienz und Leistung des Modells bei. Diese Ergebnisse unterstreichen das Potenzial von Kapselnetzwerken als effizientere und wirksamere Methode für Aufgaben der Zeichenklassifikation mit breiteren Anwendungsmöglichkeiten in verschiedenen Domänen.