Numéro Spécial Journée De La Femme | Wu Mengyue De L'université Jiaotong De Shanghai : Utiliser La Technologie De L'intelligence Vocale Pour Émettre Le Premier Diagnostic Et Ordonnance De Traitement Pour Les Maladies Mentales

Du babillage des enfants aux histoires sans fin de la jeunesse, puis à l'âge mûr, nous entendons les préoccupations et les exhortations des parents et des aînés, ainsi que l'appel constant de la pression de la vie... En y réfléchissant bien, les expériences et les souvenirs de chaque étape de la vie sont remplis de sons différents. Le chant des cigales en été et le bruit sur le terrain de basket sont la jeunesse, et les soupirs du soir et les sons de notification des messages sur les téléphones portables sont la croissance. Tout comme les gens ne peuvent pas complètement couper leur audition, même s’ils se couvrent les oreilles hermétiquement ou portent des écouteurs antibruit, le son est partout.
D'un point de vue physique, le son est une onde sonore générée par la vibration d'objets et peut être transmise par l'air. Par conséquent, le son ne peut être isolé que dans un environnement complètement sous vide. D’un autre point de vue, en tant que vecteur de langage, le son n’est pas seulement un moyen de communication important, mais aussi un moyen d’extérioriser les émotions. Avec le développement vigoureux de l’IA, la technologie analytique et les capacités associées deviennent de plus en plus puissantes. Les ondes sonores qui flottaient à l’origine dans l’air sont également devenues des données qui peuvent être étudiées et peuvent même refléter l’état de santé du corps humain.
Ces dernières années, la technologie de détection des maladies basée sur la parole a commencé à émerger dans les domaines de la médecine respiratoire, de la cardiologie, de la gastroentérologie, etc.En comparaison, l’utilisation de l’audio dans le diagnostic et le traitement des maladies mentales est mitigée :L’inquiétude est qu’il existe une grave pénurie de données audio pertinentes (principalement en raison du caractère hautement confidentiel des maladies mentales) ; La bonne nouvelle est que le diagnostic en ligne de la maladie basé sur l’audio peut aider les patients à atténuer leur sentiment de honte lors de la phase de diagnostic initiale et à déterminer s’ils sont malades le plus tôt possible.
Lu Lin, académicien de l'Académie chinoise des sciences, a mentionné dans une interview qu'à la fin de 2021, 6,6 millions de patients souffrant de troubles mentaux graves étaient enregistrés dans la base de données nationale.Le nombre de personnes recevant un traitement ne doit pas dépasser 20%.L’expansion et la promotion vigoureuses des méthodes de diagnostic basées sur l’analyse audio sont d’une grande importance pour résoudre le faible taux de traitement des maladies mentales.
Wu Mengyue, professeur associé et directeur de thèse au département d'informatique de l'université Jiao Tong de Shanghai, a publié un modèle d'intelligence vocale pour le diagnostic et le traitement des maladies mentales.Sur la base d'un modèle linguistique de grande taille, les différents rôles des médecins et des patients ont été simulés et, avec la participation conjointe de diagnosticiens de maladies mentales humaines, le premier ensemble de données de dialogue de consultation sur la dépression open source au monde répondant aux normes cliniques a été construit.

À l’occasion de la Journée internationale de la femme, HyperAI a eu l’honneur de mener une interview approfondie avec Mme Wu Mengyue et de mieux comprendre le charme de la voix et sa merveilleuse réaction avec l’IA. En même temps, nous avons également vu comment cette femme déterminée et libre d’esprit est partie de ses intérêts et a progressivement réalisé des réalisations dans son domaine professionnel.
Continuer à faire des recherches qui peuvent être mises en œuvre
Il existe des différences subtiles dans le conduit vocal, la cavité buccale, la cavité nasale, etc. de chaque personne, de sorte que les empreintes vocales des gens sont aussi différentes que les empreintes digitales et les visages. Depuis son enfance, Wu Mengyue s’intéresse beaucoup à la façon unique dont les gens se parlent. « Connaître les gens par leur voix » dans la vie quotidienne peut être considéré comme l’échelle qui l’a conduite dans le monde de l’audio.
Au cours de ses études de premier cycle, Wu Mengyue, qui était très sensible et intéressée par le son, a étudié la psychoacoustique à l'Université normale de Pékin. Durant cette période, elle réalise l’importance d’utiliser les caractéristiques acoustiques physiques pour expliquer les différences sonores au niveau technique.Et dans la phase finaleLa modélisation informatique a été choisie pour analyser les données acoustiques.

Si les premières tentatives de recherche en analyse audio dans le domaine de la psychoacoustique au cours de ses études de premier cycle ont planté une graine dans le cœur de Wu Mengyue, alors les deux projets de recherche connexes avec lesquels elle est entrée en contact étroit au cours de ses études doctorales ont servi de catalyseur.
Au cours de ses études doctorales, l'un de ses camarades de classe qui menait des recherches sur l'analyse de la voix dans le domaine de la schizophrénie est entré en contact avec un grand nombre de sans-abri souffrant de schizophrénie lors de recherches sur le terrain. Un autre colocataire, après avoir obtenu un doctorat en psychologie clinique, est entré à la prison de Melbourne pour effectuer des évaluations de la maladie mentale des prisonniers afin d'expliquer si leurs comportements criminels étaient affectés par la maladie mentale.
Les expériences de ces deux camarades de classe ont apporté une profonde inspiration et une profonde influence à Wu Mengyue. Après son retour en Chine, elle a commencé à mener des recherches plus approfondies sur le diagnostic et le traitement des maladies mentales.
Elle a dit,Dans le domaine de la phonétique, la parole et le langage sont en réalité des manifestations externes des fonctions cérébrales humaines. Ainsi, qu’il s’agisse de troubles émotionnels ou de dysfonctionnements cognitifs, ils finiront par laisser des traces dans l’expression de la parole et du langage.En d’autres termes, des biomarqueurs pertinents peuvent être trouvés dans l’audio pour dépister efficacement et facilement les personnes souffrant de troubles mentaux ou émotionnels.

En un sens, lorsque les gens hésitent à savoir s'ils doivent ou non consulter un médecin, l'analyse audio peut devenir la première liste de contrôle dans le diagnostic d'une maladie mentale et, dans une certaine mesure, affaiblir le sentiment de honte du patient.
Tout au long,Wu Mengyue insiste sur le fait de « faire de la recherche pratique ».Après avoir obtenu un doctorat, Wu Mengyue a reçu une invitation de Nuance Communications, une société de reconnaissance vocale par IA, pour tenter de s'engager dans la recherche technique et la mise en œuvre de l'interaction homme-ordinateur dans le cockpit du côté industriel. Plus tard, lors d'une conversation avec Yu Kai, professeur au département d'informatique et d'ingénierie de l'université Jiao Tong de Shanghai, elle a vu les avantages de la recherche scientifique et les nouvelles idées pour transformer les résultats au sein des universités grâce à l'expérience du professeur Yu Kai, puis est revenue du monde universitaire à l'industrie.
Wu Mengyue a dit franchement :Que ce soit dans les collèges et les universités ou dans l’industrie, l’intention initiale de « mener des recherches pratiques » n’a jamais changé.Pendant l'épidémie, son équipe de recherche a développé une application pratique de consultation sur la dépression basée sur les besoins réels, que les étudiants peuvent utiliser directement.
Enrichir l'analyse audio et surmonter les problèmes de pénurie de données
Après son retour à l'université, Wu Mengyue a choisi la direction de recherche de l'analyse audio et y a intégré davantage de technologies d'IA.Actuellement, la principale direction de recherche de son groupe de recherche est l'analyse audio riche, qui concerne de manière générale tous les traitements audio à l'exception de la reconnaissance vocale.
Wu Mengyue a expliqué que le son peut être divisé en trois niveaux :L’un est ce que les gens disent.C’est l’objet de la recherche sur la reconnaissance vocale ;La deuxième chose est la façon dont les gens parlent.Autrement dit, la même phrase peut être exprimée de nombreuses manières différentes, avec des significations différentes derrière elle, ce qui peut être utilisé pour détecter l’état mental ou la fonction cognitive d’une personne ;Le troisième est la compréhension de l’audio environnemental.C’est également la clé pour rendre les machines plus proches des humains en matière de compréhension audio. Ce qui précède constitue une analyse audio riche, parmi laquelle la reconnaissance vocale est relativement mature à l'heure actuelle, ses recherches se concentrent donc sur les deux derniers.
Actuellement, le groupe de recherche de Wu Mengyue compte plus de 20 étudiants, menant des recherches pertinentes dans ces deux directions : la psychiatrie computationnelle et la recherche pathologique sur la parole dans la compréhension audio.

En termes de scénarios d'application, par exemple, dans un environnement de conduite, la reconnaissance vocale fait référence au système interactif reconnaissant passivement les commandes et exécutant les contrôles correspondants. Si une interaction active est possible, l'humeur ou la fatigue du conducteur peut être jugée en fonction du ton de sa voix, et l'humeur peut être ajustée grâce aux lumières ou aux effets sonores de la voiture. Dans le même temps, lorsque la machine détecte que le ton de l'utilisateur n'est pas bon, elle peut également ajuster de manière synchrone la stratégie et la réflexion lors de la réponse aux instructions.
Par exemple, pendant l’épidémie, des microphones ont été utilisés pour recueillir les sons ambiants de l’ouverture et de la fermeture des portes, et le statut absent/à domicile a été analysé et déterminé. Par rapport à la surveillance par caméra traditionnelle, cette méthode est plus utile pour protéger la vie privée et la sécurité des personnes.
Dans l’impression conventionnelle, les données fiables devraient avoir une taille d’échantillon importante et être extrêmement riches, mais en fait, lorsqu’il s’agit de diagnostic et de traitement des maladies, en particulier dans le domaine des maladies mentales, les données deviennent un défi majeur. D’une part, la confidentialité de la relation médecin-patient et le sentiment de honte des patients rendent extrêmement difficile l’obtention d’enregistrements audio des conversations de conseil psychologique ; d'autre part, certains hôpitaux ou médecins peuvent enregistrer des consultations sous forme de conversations, mais aucune donnée standardisée n'est formée, la qualité audio n'est souvent pas élevée et, en raison de la protection de la vie privée, il est souvent impossible de la partager avec le monde extérieur.
à cette fin,Wu Mengyue a dirigé l'équipe de recherche chargée de créer le premier ensemble de données de dialogue de consultation sur la dépression open source au monde, répondant aux normes cliniques.La première étape consiste à établir une communication approfondie et à long terme avec les médecins et les patients du centre de santé mentale pour consolider le processus de consultation et les points de conversation, puis à organiser le contenu pertinent dans un processus de dialogue avec une structure d'arbre de décision, et à le revoir et l'ajuster à plusieurs reprises avec des médecins professionnels. Deuxièmement, nous avons simulé des dialogues médecin-patient par le biais de jeux de rôle, et avons finalement demandé à des médecins professionnels de filtrer les données obtenues pour obtenir des données plus proches des consultations cliniques, formant ainsi cet ensemble de données open source.
Lien vers le jeu de données :https://x-lance.github.io/D4/
À l’instar d’autres chercheurs engagés dans la recherche sur l’IA pour la science, l’expérience de Wu Mengyue à l’intersection de la psychologie et de l’informatique lui permet de s’attaquer aux véritables problèmes des patients actuels dans le processus de promotion du diagnostic et du traitement des maladies mentales par l’IA, et d’ajuster de manière flexible les stratégies de recherche sous la forme de données simulées lorsque la recherche rencontre des défis. Une formation interdisciplinaire peut souvent apporter des avancées innovantes dans le domaine de la recherche scientifique de manière plus créative.

Poussé par l'intérêt, vous pouvez accomplir de grandes choses
Dans l'interview avec Wu Mengyue, l'auteur a entendu le mot « intérêt » à plusieurs reprises - se concentrer sur la recherche audio est basé sur l'intérêt ; elle s'intéresse à la recherche liée au diagnostic des maladies mentales; Le passage au département informatique n'est pas une question de suivre la tendance, mais plutôt de répondre à son propre intérêt ; et elle espère également donner la priorité aux intérêts des étudiants du groupe de recherche...
Il est indéniable que, qu’il s’agisse de recherches universitaires rigoureuses ou de travaux rapides sur le lieu de travail, « l’intérêt » est un morceau de sol avec plus de nutriments. Si elle est semée dès l’enfance, la force motrice de la croissance vers le haut sera plus forte. Bien que le professeur Wu Mengyue soit basé sur ses intérêts, elle ne se relâche pas même si elle est « bouddhiste ». Qu'il s'agisse de l'accumulation de recherches scientifiques dans la fréquence de publication d'articles ou de l'application pratique de l'intégration industrie-recherche, elles sont toutes des preuves solides de sa pratique de « faire de la recherche pratique ».

Ces dernières années, de plus en plus de femmes sont devenues actives dans les domaines de la science, de la technologie et de la recherche scientifique, apportant des innovations révolutionnaires qui ont étonné le monde. Le Fonds des Nations Unies pour la femme a également choisi comme thème de la Journée internationale de la femme de cette année « Investir dans les femmes : accélérer les progrès », ce qui souligne dans une certaine mesure le rôle important des femmes dans le processus social.
Même si l’auteur ne veut pas trop insister sur les différences entre les sexes, la pression existe bel et bien dans l’environnement social réel. Mais comme l’a dit Wu Mengyue : « Concentrez-vous sur le bonheur et commencez par vos intérêts. » Surtout lorsque le monde extérieur n’a pas d’attentes excessives envers les femmes, cela signifie en réalité qu’il n’y a pas trop de restrictions. Peut-être que cela offre un espace de croissance pour accumuler de la force et exploser lorsque l’occasion se présente.
Enfin, en ce jour spécial, je souhaite que toutes les femmes puissent être comme le professeur Wu Mengyue, grandir dans leurs intérêts, absorber les nutriments en toute confiance et vivre une vie plus merveilleuse et plus libre !