HyperAI

Aidez Au Dépistage Initial De La Dépression! L'équipe De L'université Jiao Tong De Shanghai Construit Une Clinique Psychologique Agent. Le Premier Article De L'article Est Présenté En Ligne Sous Forme De Démonstration Et Partage Les Points Forts Techniques.

特色图像

Je l'ai frappée, je l'ai même étranglée et poussée dans un coin à plusieurs reprises. À chaque fois, je le regrettais. Pourquoi l'ai-je frappée ? Pourquoi n'ai-je pas réussi à me contrôler ? Suis-je un salaud, un fou ou une personne impardonnable ? Mais je ne sais vraiment pas quoi faire.C'est ce qu'a déclaré Haoran, 18 ans, face à la caméra de vidéosurveillance.

En août de cette année, Zhuang Shengchun, journaliste de l'émission « Relativity » de CCTV News, a mené une enquête approfondie sur la situation réelle de la dépression chez les adolescents. Haoran était l’un des rares adolescents souffrant de dépression à accepter de faire face à la caméra et de raconter son histoire.

De nos jours, la dépression devient de plus en plus jeune. Selon le « Rapport sur le développement de la jeunesse chinoise », environ 30 millions d’enfants et d’adolescents de moins de 17 ans souffrent de divers troubles émotionnels et de problèmes de comportement. Les adolescents sont à un âge turbulent et sont relativement fragiles psychologiquement. Si le problème n’est pas identifié et traité à temps, il évoluera vers une maladie mentale. Cependant, il existe actuellement une pénurie évidente de ressources médicales en matière de santé mentale, et la plupart des ressources sont concentrées dans les villes et les grands établissements médicaux. Cette répartition inégale fait qu’il est difficile pour de nombreux patients souffrant de dépression d’obtenir une assistance médicale en temps opportun.

En réponse à cela, l'équipe du professeur Wu Mengyue du laboratoire X-LANCE de l'Université Jiao Tong de Shanghai a collaboré avec l'Université du Texas à Arlington (UTA), le Tianqiao Brain Science Institute (TCCI) et ThetaAI.Un système automatisé de simulation d'agent de dialogue à grand modèle, l'Agent Mental Clinic (AMC), a été construit pour le diagnostic préliminaire de la dépression.

Lors de la quatrième diffusion en direct de Meet AI4S, HyperAI a invité le premier auteur de cet article de recherche, le Dr Lan Kunyao du Cross-Media Language Intelligence Laboratory de l'Université Jiao Tong de Shanghai,Sous le thème « Plateforme de diagnostic et de consultation en santé mentale basée sur un agent Big Model », il a présenté en détail les étapes d'utilisation de la plateforme, les points forts techniques et les projets futurs.

Participez à une consultation simulée à la clinique de psychologie des agents basée sur un jeu de rôle

Dans le passé, nous utilisions souvent des formulaires d’auto-évaluation (tels que PHQ9, HAM-D) pour déterminer si nous avions besoin de ressources médicales supplémentaires, comme passer des tests de santé mentale lors de notre inscription à l’école ou de notre entrée dans un emploi. Vous constaterez que pour éviter un remplissage aléatoire du formulaire, de nombreuses questions du formulaire d’auto-évaluation seront posées à plusieurs reprises pour garantir la cohérence. Cela entraîne un certain nombre de problèmes : la charge de travail est doublée et les utilisateurs trouvent cela ennuyeux.

Formulaire d'auto-test PHQ9

Maintenant, avec l'aide de l'interaction homme-machine, c'est-à-dire en discutant avec un robot de dialogue pour simuler le processus de consultation,La communication médecin-patient est devenue plus intéressante et, avec le développement de grands modèles linguistiques, l’expérience de conversation s’améliore constamment.

La clinique psychologique intelligente (AMC) proposée par l'équipe du professeur Wu Mengyue peut être utilisée pour le diagnostic préliminaire de la dépression. Sa forme principale consiste à simuler une représentation théâtrale et à réaliser des tâches de type jeu de rôle. Au cours de ce processus, les utilisateurs peuvent communiquer avec des PNJ acteurs virtuels pour faire avancer le processus de consultation. Spécifiquement,Les chercheurs ont principalement défini trois « rôles » : l’agent patient, l’agent psychiatre et l’agent instructeur.

Les utilisateurs peuvent choisir l’un de ces trois rôles à expérimenter.

Les informations détaillées sur ces trois agents sont les suivantes :

* L'agent patient présente une certaine confusion émotionnelle.Vous devez consulter un médecin pour confirmer si vous souffrez d’une maladie et déterminer si un traitement supplémentaire est nécessaire. Les chercheurs lui ont attribué différents profils d’utilisateurs, lui permettant de simuler plusieurs patients différents qui peuvent être confrontés à des problèmes différents et appartenir à des groupes d’âge différents.

Profil utilisateur

Plus précisément, les chercheurs ont utilisé une technique appelée D Ensembles de données,C’est-à-dire qu’un groupe de portraits de patients potentiels a été recruté via les réseaux sociaux ou des plateformes publiques, couvrant des informations telles que le sexe, la profession, les principales exigences et l’âge. Ces portraits ont été rigoureusement examinés et vérifiés avant d’être utilisés pour simuler des patients. Recrutez et formez des patients simulés et des médecins simulés, et les deux parties mènent des dialogues de consultation simulés. Les psychologues professionnels évaluent la qualité de ces conversations pour s’assurer qu’elles sont conformes aux scénarios réels de communication médecin-patient. Si tel est le cas, les médecins professionnels détermineront plus en détail les tendances dépressives et autodestructrices du patient. Ces diagnostics sont divisés en quatre catégories : aucune barrière, léger, modéré et sévère.

*D4 Il s'agit du premier ensemble de données de dialogue de consultation sur la dépression open source au monde qui répond aux normes cliniques.
Adresse du jeu de données :https://x-lance.github.io/D4/

Collecter D4 Ensemble de données

Lors de l'initialisation de l'agent patient, les chercheurs fourniront à l'agent patient les résultats de l'entretien médical mentionnés ci-dessus, mais n'informeront pas l'agent patient des valeurs spécifiques de tendance à la dépression et de tendance à l'automutilation, afin d'éviter les fuites de données. De plus, les symptômes du patient agent se manifestent généralement dans l'alimentation, le sommeil, l'humeur, les intérêts, la condition physique, etc., mais ces informations ne suffisent pas à décrire complètement le patient. Ils sont également confrontés à des pressions dans la vie, au travail et dans les études. Ces facteurs se reflètent généralement dans la conversation plutôt que dans les symptômes spécifiques.

À cette fin, les chercheurs ont choisi d'utiliser GPT-4 pour analyser le contenu de la conversation et découvrir les fragments de mémoire liés à l'événement, et intégrer ces souvenirs dans le module de mémoire de l'agent patient, tels que des informations sur la trahison conjugale, les échecs dans le travail et les études, etc.

* Le cadre de l'Agent psychiatre est celui d'un nouveau médecin sans expérience de consultation.L’objectif est de tester si le médecin peut faire des progrès significatifs dans la communication avec les patients.

Du côté du médecin, l'agent ne bénéficiera pas d'une grande expérience pratique au stade initial, mais les chercheurs fourniront quelques informations professionnelles de base, telles que des descriptions textuelles de troubles dépressifs à épisode unique et de troubles dépressifs récurrents, dans le cadre de la mémoire initiale de l'agent du médecin. À mesure que le nombre d'interactions avec les patients augmente, les compétences et l'expérience de l'agent médical continueront de s'accumuler, améliorant ainsi le niveau de consultation.

* L’objectif principal de l’agent instructeur est de contrôler le flux du dialogue médecin-patient.Évitez les conversations qui durent indéfiniment. À l’avenir, si l’on étend cette approche aux scénarios de conseil familial, par exemple lorsque les parents et les enfants ou les couples se consultent ensemble, l’interaction entre plusieurs agents peut provoquer des conflits, et l’agent instructeur peut aider à coordonner le processus de conversation.

Au cours du processus de consultation,Le médecin pose des questions, le patient répond et l’instructeur suit les réponses du patient et enregistre les symptômes de la maladie. Après avoir comparé les symptômes du patient avec des tests standards tels que la CIM-11 et le DSM-5, l'instructeur indiquera les problèmes qui n'ont pas été résolus et donnera au médecin des conseils sur les prochaines questions à poser. Sur la base de ces instructions, les médecins posent de nouvelles questions aux patients, formant ainsi un cycle interne. À la fin de chaque entretien, le médecin évaluera les tendances dépressives et autodestructrices du patient.

Architecture de la clinique de psychologie des agents

L'instructeur reçoit ces résultats d'évaluation et les compare avec le D4 Les données sont comparées aux résultats réels du diagnostic du médecin stockés dans l'ensemble de données. En fonction des différences entre l'historique de la conversation et les résultats du diagnostic, l'instructeur évaluera la performance du médecin lors de la consultation, y compris l'expression du langage, les méthodes de questionnement et la précision du diagnostic. Enfin, l'instructeur stockera la mémoire réfléchie dans les compétences diagnostiques du médecin pour aider l'agent médecin à acquérir plus d'expérience et à grandir au cours du processus de consultation.

Il convient de mentionner que pour mieux récupérer la mémoire adaptative afin de traiter les conversations et les diagnostics, les chercheurs ont également proposé une structure de mémoire innovante à trois couches et un module de récupération de mémoire, à savoir l'historique des conversations, les dossiers médicaux électroniques et les compétences de résumé.

La plateforme continue de s'optimiser et l'avenir est prometteur

Au cours du processus de jeu de rôle, les chercheurs ont également rencontré plusieurs problèmes et les optimiseront à l'avenir.

Tout d’abord, il y a le problème des hallucinations.Autrement dit, le modèle produira des réponses dans la conversation qui ne sont pas cohérentes avec les faits. Il s’agit d’un problème courant pour tous les grands modèles. Par exemple, un patient peut avoir eu des pensées d’automutilation au cours du mois dernier mais ne pas les avoir mises à exécution, mais le modèle peut quand même répondre à tort que le patient a un comportement d’automutilation chaque mois. Ce faux positif est plus évident dans les longues conversations. Afin de faire face au phénomène d'hallucination, lorsqu'ils rencontrent des problèmes similaires, les chercheurs ont utilisé certains symptômes clés dans les portraits d'utilisateurs comme incitations pour inciter davantage le modèle, mais cette approche ne peut que temporairement atténuer le phénomène d'hallucination, et des efforts supplémentaires sont encore nécessaires à l'avenir.

Un autre problème est le style de langage.Les patients n'utilisent souvent pas de termes techniques pour décrire leur état lors de leur première consultation chez le médecin, mais le modèle a tendance à utiliser des termes techniques tels que « retard neuromoteur », qui ne correspondent pas aux performances du patient lors de la première consultation.

Cas de style de langue, cas de répétition

De plus, les chercheurs ont observé que le modèle avait tendance à poser des questions répétées.Par exemple, influencés par les conversations historiques passées, les remarques d’ouverture et de clôture du modèle sont relativement fixes, et la manière de poser les questions est également relativement cohérente. Mais dans les conversations réelles, ces éléments peuvent changer et les réponses sont également diverses. Comment apporter un confort approprié pour que la conversation ne soit pas ennuyeuse est également un problème qui doit être pris en compte à l’avenir.

Les principaux problèmes rencontrés lors de l’optimisation du contenu ci-dessus sont des normes d’évaluation incohérentes et la rareté des ensembles de données de scénarios professionnels.En mai de l'année dernière, le Dr Chen Siyuan de l'équipe du professeur Wu Mengyue a simulé des conversations médecin-patient sur la base d'un grand modèle linguistique. Les résultats de la recherche ont montré que le grand modèle présenterait des différences évidentes en termes de termes par rapport aux termes humains. En modifiant l’invite et en incitant le modèle à utiliser des expressions familières, ce symptôme peut être partiellement atténué.

Résultats de recherche de Chen Siyuan

En ce qui concerne le problème des normes d'évaluation incohérentes, les gens ont généralement une compréhension générale des « conversations de haute qualité », mais il existe des différences significatives dans les normes d'évaluation des conversations de « qualité moyenne » et de « mauvaise qualité ». Cela peut être dû à des erreurs subjectives dans les évaluations individuelles, des tests humains à plus grande échelle sont donc nécessaires. De plus, de nombreuses études utilisent des modèles de haute qualité tels que GPT-4 pour évaluer d’autres modèles. Cependant, les grands modèles sont des boîtes noires avec une interprétabilité relativement faible, et la qualité et le nombre d’évaluateurs humains sont limités. Il manque donc encore une norme d’évaluation automatisée à grande échelle.

De plus, les ensembles de données requis pour différents scénarios d’application varient. En particulier dans les scénarios professionnels, la taille de l’échantillon disponible est souvent petite, ce qui peut affecter la fiabilité du test et également limiter la formation de grands modèles. À cet égard, Lan Kunyao estime qu’une solution future consiste à introduire le concept de modèle cognitif psychologique dans la pratique du jeu de rôle. Si nous pouvons établir un modèle cognitif plus général pour s’adapter à différents scénarios et mapper efficacement les ressources réseau existantes à ce modèle, il deviendra plus facile d’obtenir des ensembles de formation et de test ultérieurs, ce qui est une direction qui mérite d’être explorée.

« Pour ma part, j'ai toujours voulu explorer plus en profondeur si ces modèles probabilistes peuvent éventuellement former une pensée de la personnalité complète et indépendante, et j'espère trouver une manière plus stable d'évaluer les caractéristiques de la personnalité inhérentes aux grands modèles de langage. »Lan Kunyao a déclaré que, selon lui, étant donné que ces modèles ont appris une grande quantité de corpus d'utilisateurs et de données utilisateur, ils devraient théoriquement être capables de présenter un trait de personnalité. Sur cette base, il faut discuter de la manière d’évaluer si le modèle possède ce trait de personnalité et de la manière dont ce trait de personnalité affecte ses performances en matière de réponse aux questions, aux processus cognitifs et aux besoins des utilisateurs (tels que le confort psychologique). « Si nous pouvons localiser et distinguer les traits de personnalité ou les modules de personnalité du modèle, nous pouvons l'adapter à différents scénarios et besoins et effectuer différentes tâches, ce qui est plus efficace que de se fier uniquement à un réglage rapide. »

Changer le monde grâce à la technologie

J'ai étudié le traitement d'images en licence et me suis progressivement intéressé au traitement du langage naturel lors de mes études supérieures. À l'époque, mes recherches portaient sur l'éducation intelligente, et c'est à cette époque que j'ai découvert un sujet lié aux besoins d'apprentissage personnalisés des étudiants. Plus tard, en concevant un compagnon d'apprentissage pour les étudiants,J’ai constaté que les étudiants ont besoin non seulement d’une aide scolaire, mais aussi d’un soutien psychologique.Ainsi, au cours de mes études doctorales, j’ai rejoint l’équipe du professeur Wu Mengyue, dans l’espoir de mener une exploration plus approfondie dans le domaine de la psychologie. « Le Dr Lan Kunyao a déclaré cela en parlant de l'intention initiale de créer la clinique psychologique des agents à grande échelle.

Le professeur Wu Mengyue est un professionnel rare doté d’une formation interdisciplinaire en psychologie et en informatique. Dans le cadre de la promotion du diagnostic et du traitement des maladies mentales grâce à l’IA, elle peut répondre avec précision aux besoins réels des patients et ajuster de manière flexible les stratégies de recherche.

Le laboratoire Cross Media Language Intelligence Lab (X-LANCE) de l'Université Jiao Tong de Shanghai où elle travaille est désormais devenu le « Cross-Modal Language Intelligence Lab », couvrant les principaux domaines de recherche du traitement de l'information linguistique audiovisuelle et impliquant également le domaine de la chimie des matériaux. L’équipe s’engage à mener des recherches technologiques de pointe qui peuvent changer le monde. Le credo académique du laboratoire est le suivant : pour changer le monde grâce à la technologie, il faut d'abord être un excellent ingénieur, et un ingénieur exceptionnel doit être un scientifique.
Page d'accueil du laboratoire :https://x-lance.sjtu.edu.cn

Photo d'équipe

Le laboratoire a reçu le soutien de nombreux projets nationaux et d'entreprise, notamment le Programme national de recherche et développement clé et le Fonds d'excellence pour les jeunes scientifiques de la Fondation nationale des sciences naturelles de Chine. Elle a également coopéré en profondeur avec AIS Technology Co., Ltd. pour établir le « Laboratoire conjoint d'interaction homme-machine intelligente AIS de l'Université Jiao Tong de Shanghai ». Il dispose de riches ressources de données et d'une grande quantité de ressources de calcul, notamment des centaines de cartes GPU H800, A800 et A10. C'est l'un des rares laboratoires d'intelligence artificielle au monde capable de mener des analyses et des recherches de données à grande échelle au niveau industriel.