Par Super Neuro
Dans les films et séries télévisées de détectives criminels, on voit souvent apparaître des « experts en identification d'écriture manuscrite ». Ces personnes porteront un jugement préliminaire sur l’identité, l’âge et la mentalité d’une personne en se basant sur l’écriture laissée sur les lieux.
Désormais, l’IA peut être utilisée pour déterminer directement la nationalité de l’auteur, éliminant ainsi le besoin de travaux d’enquête et de collecte de preuves supplémentaires.
Dans les années 1980, un soi-disant collectionneur nazi est venu dans une maison d'édition allemande avec 60 exemplaires des « Journaux d'Hitler ».
L'éditeur a acheté les journaux pour 2,3 millions de dollars et a vendu les droits de réimpression à plusieurs journaux étrangers.
Parmi eux, le Times a invité un certain nombre d'experts à procéder à l'identification de notes en utilisant une copie du manuscrit d'Hitler comme échantillon. Les experts ont conclu : c'est vrai ! C'est l'écriture d'Hitler !
Cependant, des tests ultraviolets ultérieurs ont révélé la présence d'un ingrédient spécial dans le papier de cet ensemble de journaux, qui n'a en fait été utilisé qu'en 1954.
Cet ensemble de journaux est certainement un faux, les résultats de l’identification de l’écriture manuscrite par les experts sont-ils également erronés ?
En fait, non, l’enquête finale a révélé que cela était dû au fait que les véritables ensembles de données utilisés pour la comparaison étaient les soi-disant « manuscrits ». En fait, il a également été falsifié par ce collectionneur frauduleux.
L'identification de l'écriture manuscrite est importante
L’écriture manuscrite est une trace particulière qui peut refléter les habitudes d’écriture uniques d’une personne. L'identification de l'écriture manuscrite est le processus de comparaison et d'identification de deux ou plusieurs notes pour déterminer si elles ont été écrites par la même personne.
L’identification de l’écriture manuscrite est également souvent utilisée pour régler les litiges relatifs aux œuvres d’art, aux contrats, aux testaments, etc.Désormais, l’IA peut être utilisée pour effectuer directement l’identification de l’écriture manuscrite afin de confirmer la nationalité.
Actuellement, nous ne ciblons que cinq pays
Grâce à cet algorithme, l’IA peut analyser le texte manuscrit en anglais d’une personne pour déterminer sa nationalité.
Actuellement, cette technologie ne peut déterminer que si la nationalité des participants appartient à l’un des cinq pays suivants : la Malaisie, l’Iran, la Chine, le Bangladesh et l’Inde.
Les chercheurs ont sélectionné 100 personnes de ces pays comme sujets expérimentaux et leur ont demandé d’écrire à la main un article anglais de 500 lignes comme ensemble de données pour l’apprentissage automatique.
Grâce à un outil appelé « Cloud Of Line Distribution (COLD) »,Les chercheurs ont pu décomposer chaque lettre en lignes et déterminer leur nationalité en mesurant à quel point les lignes étaient droites ou courbées.
Des expériences ont montré que COLD est bien compatible avec les algorithmes d’apprentissage automatique. Elle est plus efficace que la plupart des méthodes existantes pour déterminer la nationalité, et la précision de la prédiction pour certains pays a plus que doublé.
Les habitudes d’écriture des différents pays sont la clé de la capacité de COLD à déterminer la nationalité.
Par exempleLes Chinois ont l'habitude d'écrire en caractères carrés et d'utiliser des lignes plus droites lorsqu'ils écrivent des lettres anglaises, tandis que les Indiens ont l'habitude d'écrire avec des courbes, il y a donc plus de parties courbes lors de l'orthographe des lettres.
Comment fonctionne COLD ?
COLD est un outil spécifiquement utilisé pour l'analyse de texte. Outre son application dans l'analyse de l'écriture manuscrite, il est également largement utilisé pour la détection de texte arbitraire dans des domaines tels que les vidéos et les images de plaques d'immatriculation.
Cette méthode peut analyser les caractéristiques du texte, puis classer le texte en fonction de forêts aléatoires et générer des points denses dans le domaine de coordonnées polaires correspondant.
Ces points ne sont pas distribués aléatoirement, mais sont infiniment proches du pays avec lequel ils sont le plus similaires. Par conséquent, à mesure que la répartition des caractères change, la répartition nationale changera également. Tant que les données sont suffisamment riches, il est facile de tirer des conclusions grâce à SVM (Support Vector Machine).
Les résultats de l’analyse de l’IA ne sont pas entièrement fiables
Auparavant, nous entendions rarement parler de recherches sur l’analyse de l’écriture manuscrite, peut-être parce que ses scénarios d’application n’avaient pas été déterminés.
Cependant, des chercheurs de Chine, d’Inde et de Malaisie estiment que cette technologie peut aider la police à mener des enquêtes criminelles et qu’elle est plus efficace que la technologie générale de reconnaissance d’images.
Méthode traditionnelle d'identification médico-légale
En fait, la police utilise la technologie biométrique dans de nombreux domaines d’enquête, et la reconnaissance faciale est l’une des méthodes les plus couramment utilisées. L’émergence de la reconnaissance de l’écriture manuscrite deviendra, dans une certaine mesure, un puissant complément à cette technologie.
Cependant, cette technologie est encore au stade expérimental et il reste à déterminer si elle peut être utilisée dans des scénarios réels.
Comme la plupart des technologies biométriques, la reconnaissance de l’écriture manuscrite est confrontée à certains problèmes de confidentialité ou de droits civils soulevés par cette technologie ou des technologies similaires.
En outre, la question de savoir comment garantir que les données utilisées pour l’apprentissage automatique ne prennent pas de mauvaises décisions en raison de biais est également un problème qui doit être résolu de toute urgence.