AKHCRNet : Reconnaissance de caractères manuscrits bengalis à l’aide du deep learning

Je propose une solution d’architecture de réseau neuronal profond de pointe pour la reconnaissance de caractères manuscrits dans l’alphabet bengali, y compris les caractères composés ainsi que les chiffres numériques, atteignant une précision record de 96,8 % en seulement 11 époques. Des travaux similaires ont été menés précédemment par Chatterjee, Swagato, et al., qui ont obtenu une précision de 96,12 % en environ 47 époques. L’architecture neuronale profonde utilisée dans cette étude était relativement volumineuse, notamment en raison de l’inclusion des poids du modèle ResNet50, un réseau résiduel de 50 couches entraîné initialement sur le jeu de données ImageNet. Le modèle proposé ici atteint une précision supérieure à celle de toutes les approches antérieures, et ce en un nombre bien moindre d’époques. Bien que ResNet50 soit un modèle performant entraîné sur ImageNet, je propose une architecture dédiée à la reconnaissance de caractères manuscrits (HCR), conçue spécifiquement pour les caractères bengalis, entraînée à partir de zéro sans recourir à l’apprentissage par ensemble (ensemble learning), et capable de surpasser les architectures précédentes en termes de performance.