HyperAIHyperAI
il y a 2 mois

EMNIST : une extension de MNIST aux lettres manuscrites

Gregory Cohen; Saeed Afshar; Jonathan Tapson; André van Schaik
EMNIST : une extension de MNIST aux lettres manuscrites
Résumé

L'ensemble de données MNIST est devenu un benchmark standard pour les systèmes d'apprentissage, de classification et de vision par ordinateur. Son adoption généralisée s'explique par la nature compréhensible et intuitive de la tâche, sa taille relativement petite et ses exigences en matière de stockage, ainsi que l'accessibilité et la facilité d'utilisation de la base de données elle-même. L'ensemble de données MNIST a été dérivé d'un ensemble plus vaste connu sous le nom de NIST Special Database 19, qui contient des chiffres, des lettres majuscules et minuscules écrites à la main. Cet article présente une variante du jeu de données NIST complet, que nous avons appelée Extended MNIST (EMNIST), qui suit le même paradigme de conversion utilisé pour créer l'ensemble de données MNIST. Le résultat est une série d'ensembles de données constituant des tâches de classification plus complexes impliquant des lettres et des chiffres, tout en partageant la même structure d'image et les mêmes paramètres que la tâche originale MNIST, ce qui permet une compatibilité directe avec tous les classifieurs et systèmes existants. Des résultats benchmark sont présentés, accompagnés d'une validation du processus de conversion par comparaison des résultats de classification sur les chiffres convertis du NIST et ceux du MNIST.

EMNIST : une extension de MNIST aux lettres manuscrites | Articles de recherche récents | HyperAI