HyperAIHyperAI
il y a 2 mois

Détection omnidirectionnelle du texte dans les scènes avec discrétisation de boîtes sans séquence

Yuliang Liu; Sheng Zhang; Lianwen Jin; Lele Xie; Yaqiang Wu; Zhepeng Wang
Détection omnidirectionnelle du texte dans les scènes avec discrétisation de boîtes sans séquence
Résumé

Le texte en scène dans des conditions réelles est souvent présenté avec des caractéristiques variant considérablement. L'utilisation d'une boîte de délimitation quadrilatère pour localiser les instances de texte est presque indispensable pour les méthodes de détection. Cependant, des recherches récentes ont révélé que l'introduction d'une boîte de délimitation quadrilatère pour la détection du texte en scène peut entraîner un problème de confusion des étiquettes, qui est facilement négligé, et ce problème peut considérablement affaiblir les performances de détection. Pour résoudre ce problème, dans cet article, nous proposons une nouvelle méthode appelée Discrétisation de Boîte sans Séquence (Sequential-free Box Discretization, SBD) en discrétisant la boîte de délimitation en arêtes clés (Key Edges, KE), ce qui permet d'élaborer des méthodes plus efficaces pour améliorer les performances de détection. Les expériences ont montré que la méthode proposée surpassait les méthodes de pointe dans de nombreux benchmarks populaires de texte en scène, tels que ICDAR 2015, MLT et MSRA-TD500. Une étude d'ablation a également montré que l'intégration simple du SBD dans le cadre Mask R-CNN améliorait considérablement les performances de détection. De plus, une expérience sur le jeu de données général d'objets HRSC2016 (navires multi-orientés) a montré que notre méthode surpassait largement les méthodes récentes de pointe, démontrant ainsi sa puissante capacité de généralisation. Code source : https://github.com/Yuliang-Liu/Box_Discretization_Network.

Détection omnidirectionnelle du texte dans les scènes avec discrétisation de boîtes sans séquence | Articles de recherche récents | HyperAI