Ensemble De Données De Détection De Texte MSRA-TD500
Date
Taille
URL de publication
Catégories
L'ensemble de données d'images MSRA-TD500 est utilisé pour évaluer le benchmark de l'algorithme de détection de texte. Il contient 500 images naturelles de différentes catégories et langues, dont 300 images d'entraînement et 200 images de test.
L'ensemble de données est capturé à partir de scènes intérieures et extérieures à l'aide d'une caméra de poche. Les images intérieures sont principalement des panneaux, des panneaux de porte et des panneaux d'avertissement, tandis que les images extérieures sont principalement des plaques de guidage et des panneaux d'affichage sous des arrière-plans complexes. La résolution de l’image varie de 1296 × 864 à 1920 × 1280.
Les images contiennent du chinois et de l'anglais, et chaque image est entièrement annotée en lignes, les personnes difficiles à identifier ayant du mal à les annoter.
L'ensemble de données MSRA-TD500 a été publié par l'Université des sciences et technologies de Huazhong au CVPR en 2012. Les principaux éditeurs sont C. Yao, X. Bai, W. Liu, Y. Ma et Z. Tu.