Pixelgenaue Rekonstruktion und Klassifizierung für rauschige handschriftliche Bengali-Zeichen

Klassifizierungstechniken für Bilder von handschriftlichen Zeichen sind anfällig für Rauschen. QuadBäume können eine effiziente Darstellung für das Lernen aus dünn besetzten Merkmalen sein. In dieser Arbeit verbessern wir die Effektivität probabilistischer QuadBäume, indem wir einen Pixel-Level-Klassifikator verwenden, um die Zeichenpixel zu extrahieren und Rauschen aus handschriftlichen Zeichenbildern zu entfernen. Der Pixel-Level-Entrauscher (ein tiefes Glaubensnetz) verwendet die Kartenantworten, die von einem vorab trainierten CNN als Merkmale zur Rekonstruktion der Zeichen ohne Rauschen gewonnen werden. Wir demonstrieren die Effektivität unseres Ansatzes experimentell durch die Rekonstruktion und Klassifizierung einer rauschigen Version der Datensätze von handschriftlichen bangalischen Ziffern und grundlegenden Zeichen (Bangla Numeral and Basic Character datasets).