HyperAIHyperAI
il y a 2 mois

Réseaux Neuronaux Profonds Multi-colonnes pour la Classification d'Images

Dan Cireşan; Ueli Meier; Juergen Schmidhuber
Réseaux Neuronaux Profonds Multi-colonnes pour la Classification d'Images
Résumé

Les méthodes traditionnelles de vision par ordinateur et d'apprentissage automatique ne peuvent pas égaler les performances humaines dans des tâches telles que la reconnaissance de chiffres manuscrits ou de panneaux de signalisation routière. Nos architectures de réseaux neuronaux artificiels profonds, biologiquement plausibles, y parviennent. Les petits champs récepteurs (souvent minimaux) des neurones convolutifs gagnant-le-tout confèrent une grande profondeur au réseau, entraînant un nombre approximativement similaire de couches neuronales peu connectées entre la rétine et le cortex visuel chez les mammifères. Seuls les neurones gagnants sont formés. Plusieurs colonnes neuronales profondes deviennent des experts sur des entrées prétraitées différemment ; leurs prédictions sont ensuite moyennées. Les cartes graphiques permettent une formation rapide. Sur le benchmark très compétitif MNIST pour la reconnaissance d'écriture manuscrite, notre méthode est la première à atteindre une performance quasi-humaine. Sur un benchmark de reconnaissance de panneaux de signalisation routière, elle dépasse les performances humaines par un facteur de deux. Nous améliorons également l'état de l'art sur une multitude de benchmarks courants pour la classification d'images.

Réseaux Neuronaux Profonds Multi-colonnes pour la Classification d'Images | Articles de recherche récents | HyperAI