La Clinique Psychologique Agent Est En Ligne ! Sur La Base De 1 300 Dialogues De Consultation Sur La Dépression, L’équipe De L’université Jiaotong De Shanghai a Construit Un Agent De Dialogue Modèle De Grande Taille Capable De Diagnostiquer La Dépression.

Les problèmes de santé mentale sont l’un des plus grands défis auxquels la société est confrontée aujourd’hui. Selon le Rapport mondial sur la santé mentale de l’OMS, environ 246 millions de personnes souffrent de troubles dépressifs, avec une moyenne de 3 153 cas pour 100 000 personnes. On peut dire qu’il s’agit de l’un des troubles mentaux les plus courants.
Cependant, aujourd’hui, les ressources consacrées à la santé mentale restent insuffisantes, en particulier dans les pays à revenu faible ou intermédiaire. En outre, dans tous les pays et régions,Les ressources médicales professionnelles en santé mentale sont principalement concentrées dans les villes et les grandes institutions, ce qui entraîne un déséquilibre dans l’allocation des ressources hospitalières.Il est donc difficile pour les patients souffrant de troubles mentaux tels que la dépression d’obtenir une assistance médicale appropriée en temps opportun.
Afin de mieux répartir les ressources médicales et d’atténuer le dilemme des contraintes de ressources, des méthodes de diagnostic automatisées de la dépression efficaces et précises sont importantes et essentielles. Parmi les différentes méthodes de diagnostic automatisées, les agents conversationnels sont considérés comme très efficaces en raison de leur rentabilité, de leur gain de temps et du maintien de l'anonymat de l'utilisateur. Il convient de noter qu’au fur et à mesure que la conversation diagnostique progresse,La stratégie de dialogue de l’agent doit évoluer en fonction de l’état mental du patient et de l’évolution de la relation médecin-patient.Cela pose sans aucun doute un défi majeur à la construction d’agents de dialogue.
En réponse aux problèmes ci-dessus,L'équipe du professeur Mengyue Wu du laboratoire X-LANCE de l'université Jiao Tong de Shanghai, en collaboration avec l'université du Texas à Arlington (UTA), le Tianqiao Brain Science Institute (TCCI) et ThetaAI, a construit un système automatisé de simulation d'agent de dialogue à grand modèle - Agent Mental Clinic (AMC).Utilisé pour le diagnostic initial de la dépression. Ce système peut simuler à la fois un psychiatre et un patient potentiel souffrant de dépression, et simuler une conversation de consultation sur la dépression. De plus, afin d’optimiser le processus de conversation et de guider les psychiatres, l’AMC a également conçu un rôle d’instructeur pour fournir aux psychiatres des conseils pour le prochain cycle de conversation. Tous les rôles du système peuvent être joués par de vraies personnes ou mis en œuvre par de grands modèles.
Afin de mieux s'adapter aux besoins de l'environnement de diagnostic, AMC utilise les idées de construction d'agents de grands modèles populaires et propose également une structure de stockage de mémoire à trois couches et un nouveau mécanisme de récupération de mémoire pour obtenir une consultation de dépression et un dépistage initial plus efficaces et plus précis. Ce système de dialogue peut non seulement être utilisé pour le dépistage préliminaire des patients potentiellement dépressifs, mais peut également être utilisé pour former des psychiatres stagiaires ou des étudiants, en leur fournissant des conseils et une assistance avant qu'ils n'entrent officiellement dans le département pour un stage. Le rôle d'instructeur qui peut être joué par les psychiatres professionnels fournit également des idées d'optimisation réalisables pour l'agent psychiatre basé sur le grand modèle.
La recherche connexe, intitulée « Simulation de dialogue sur le diagnostic de la dépression : un psychiatre auto-amélioré avec une mémoire tertiaire », a été publiée sous forme de pré-impression.
Points saillants de la recherche :
* Un nouveau type de système de simulation d'agent de dialogue a été construit pour simuler la conversation diagnostique entre l'agent patient et l'agent psychiatre, offrant une nouvelle méthode efficace pour la formation des psychiatres stagiaires et le dépistage préliminaire des patients potentiels souffrant de dépression.
* Proposer une structure de mémoire innovante à trois couches et un module de récupération de mémoire pour améliorer les capacités de synthèse de l'agent au stade du diagnostic, offrant une nouvelle direction pour l'optimisation du diagnostic de la dépression et de la simulation de dialogue à l'avenir.
* Le système AMC a amélioré à la fois le diagnostic de la dépression et la prédiction du suicide, et le cadre peut être appliqué à d’autres domaines spécifiques et convient à la formation avec des cas étiquetés limités.

Adresse du document :
https://arxiv.org/abs/2409.15084
Le projet open source « awesome-ai4s » rassemble plus de 100 interprétations d'articles AI4S et fournit des ensembles de données et des outils massifs :
https://github.com/hyperai/awesome-ai4s
D4 Ensemble de données vérifiées par des médecins professionnels
D4 L'ensemble de données a été collecté par l'équipe du professeur Wu Mengyue et sa qualité a été vérifiée par des médecins professionnels.La collecte de l'ensemble de données de dialogue comporte trois étapes :
* Distribuer des questionnaires sur les réseaux sociaux et autres plateformes pour recueillir et construire des portraits personnels de vrais patients potentiellement atteints de dépression.
* Recruter et former des patients simulés et des médecins simulés, fournir aux patients simulés les portraits collectés de patients souffrant de dépression, puis demander aux médecins simulés et aux patients simulés de mener un dialogue de consultation sur la dépression.
* Les conversations simulées collectées seront remises à des psychiatres professionnels pour vérifier la qualité des conversations de consultation, et la gravité de la dépression et un résumé des symptômes seront effectués pour les conversations qui répondent aux normes de qualité.

Après collecte et vérification, l'équipe du professeur Wu Mengyue a recueilli un total de 1 339 conversations de qualité satisfaisante pour la construction de l'ensemble de données de consultation sur la dépression D4. Le degré de dépression a été divisé en quatre catégories principales : aucun (430 conversations), léger (342 conversations), modéré (368 conversations) et sévère (199 conversations), avec un nombre moyen de cycles de conversation de 21,6 cycles. Par la suite, l’équipe du professeur Wu Mengyue a proposé un cadre d’annotation de diagnostic des symptômes de dépression SEO pour annoter l’ensemble de données D4.

Structure de mémoire innovante à trois couches et module de récupération de mémoire
Les chercheurs ont proposé un système automatisé de simulation d'agent de dialogue à grand modèle avec une structure de stockage de mémoire à trois couches et un nouveau mécanisme de récupération de mémoire, qui comprend trois modules :
* Agent du patient :L'agent patient est initialisé à l'aide des informations utilisateur extraites du portrait utilisateur D4 et du dialogue de consultation sur la dépression. AMC a sélectionné 100 cas classiques de D4 comme ensemble de formation et a utilisé GPT-4 pour extraire des informations sur les événements du dialogue de consultation médicale comme nœud de mémoire initial du patient.
* Agent psychiatre :La description et les bases diagnostiques des troubles dépressifs de la CIM-11 ont été utilisées pour l'initialisation, et les dossiers médicaux électroniques du patient ainsi que les compétences diagnostiques résumées ont été accumulés au fur et à mesure de la progression du diagnostic.
* Plugin superviseur :Il est utilisé pour comparer les résultats du diagnostic de l'agent psychiatre avec l'agent patient, et résumer l'expérience et la transmettre à l'agent psychiatre pour stockage.

Le processus de fonctionnement de l'ensemble du système AMC est illustré dans la figure, qui comporte 6 étapes au total :
1. Initialisez un lot d'agents patients à l'aide de portraits de patients générés par GPT-4 sur la base des données collectées par D4. Les résultats du diagnostic des troubles dépressifs ne seront pas fournis à l’agent du patient lors du processus de consultation du patient. 2. L'agent patient et l'agent psychiatre discutent d'une consultation sur la dépression.
3. Au cours de la deuxième étape, le plug-in de l'instructeur suivra les symptômes mentionnés par le patient et fournira à l'agent psychiatre des suggestions pour la prochaine étape de la conversation en fonction de la progression de la conversation.
4. Une fois le dialogue de consultation terminé, le plug-in de l'instructeur compare le diagnostic final de l'agent psychiatre sur le patient avec le diagnostic réel du médecin stocké dans D4. 5. Le module d'extension de l'instructeur résumera les conseils fournis à l'agent psychiatre en fonction de la comparaison des résultats du diagnostic et les fournira à l'agent psychiatre.
6. Après avoir terminé un processus de consultation, le psychiatre appelle le prochain patient Agent pour le diagnostic et répète le processus.

Pour mieux récupérer une mémoire adaptée au traitement des conversations et des diagnostics,Les chercheurs ont construit une architecture de mémoire d’agent à trois couches : historique des conversations, dossiers médicaux électroniques et compétences de résumé.dans:
* L'historique du diagnostic est l'historique du dialogue en cours ;
* Les dossiers médicaux électroniques (DME) sont des résumés des conversations rédigés par l'agent psychiatre après chaque consultation du patient, y compris les plaintes du patient, ses symptômes et d'autres informations sur l'événement ;
* Les compétences de diagnostic sont des avis d'orientation résumés par le plug-in de l'instructeur et stockés dans la mémoire de l'agent psychiatre, ce qui permet d'optimiser le processus de conversation et la précision du diagnostic.

Conclusion expérimentale : Améliorer la précision du diagnostic de la dépression et des tendances suicidaires
Pour évaluer l’efficacité de l’AMC, les chercheurs ont mené deux séries d’expériences sur l’ensemble de test D4.
L’une consiste à utiliser le dialogue original de D4 comme dialogue de consultation entre l’agent psychiatre et l’agent patient pour effectuer le diagnostic, qui est utilisé pour tester la capacité diagnostique du modèle. La deuxième consiste à établir un diagnostic à travers un dialogue entre l'agent psychiatre et l'agent patient, en examinant de manière exhaustive la capacité de jeu de rôle et la capacité de diagnostic de l'agent.
Les chercheurs ont calculé séparément la précision diagnostique des troubles dépressifs et des tendances suicidaires (classés comme nuls, légers, modérés et graves). En comparant le système AMC avec et sans mémoire, les résultats montrent que les performances globales du modèle sur l’ensemble de test se sont améliorées.L'efficacité de l'AMC dans l'utilisation de l'architecture de mémoire hiérarchique a été vérifiée, et le diagnostic simple et le dialogue + diagnostic peuvent être améliorés dans une certaine mesure.

Afin de vérifier davantage l'efficacité de la structure de mémoire à trois couches,Les chercheurs ont mené une expérience d'ablation et ont découvert que l'ajout simultané de la mémoire des dossiers médicaux électroniques et des compétences de synthèse pouvait apporter une amélioration stable de la précision du modèle, prouvant ainsi l'efficacité de la structure de mémoire à trois couches.

Pour vérifier l'efficacité du plugin instructeur,Les chercheurs ont également mené des expériences d’ablation sur des plug-ins. Les expériences montrent que le plug-in de l'instructeur a également un certain effet d'amélioration sur l'architecture du système AMC.

Découvrez les secrets du son
Ces dernières années, l’IA a démontré de puissantes capacités dans le diagnostic et le traitement de diverses maladies, telles que la détection vocale des maladies respiratoires et gastro-intestinales. Cependant, les progrès dans le diagnostic et le traitement des maladies mentales ont été lents en raison d’un manque de données pertinentes de haute qualité. La raison est que la plupart des patients souffrant de maladies mentales ont encore un sentiment de honte à propos de leur maladie, et les dossiers médicaux pertinents impliquent la confidentialité des patients, il est donc difficile de constituer un ensemble de données à grande échelle pour la formation des modèles d’IA.
La principale direction de recherche du groupe de recherche de Wu Mengyue est la psychiatrie computationnelle et la recherche sur la parole pathologique dans la compréhension audio.L'ensemble de données D4 utilisé dans la recherche mentionnée ci-dessus est le premier ensemble de données de dialogue de consultation sur la dépression open source au monde qui répond aux normes cliniques, construit par son équipe, fournissant une base solide pour la recherche connexe.
Il convient de mentionner que le professeur Wu Mengyue possède une riche expérience personnelle, une formation en recherche psychoacoustique et s'engage à combiner l'IA avec la recherche en santé mentale. HyperAI a mené une interview approfondie avec le professeur Wu Mengyue.Cliquez pour voir le rapport complet : Wu Mengyue de l'Université Jiao Tong de Shanghai : Utiliser la technologie de l'intelligence vocale pour émettre le premier diagnostic et la première ordonnance de traitement pour les maladies mentales.
Le premier auteur de cet article de recherche est Lan Kunyao, titulaire d'un doctorat. étudiant au Département d'informatique, École d'information électronique et de génie électrique, Université Jiao Tong de Shanghai.Il est diplômé de l'Université Jiao Tong de Shanghai avec une licence en sécurité de l'information. Son principal domaine de recherche est le système de dialogue pour le diagnostic et le traitement des maladies mentales. Il a remporté le deuxième prix du concours d'innovation technologique et d'application en médecine mathématique 2023 et le premier prix du 13e concours national de sécurité de l'information des étudiants universitaires.

Le laboratoire X-LANCE de l'Université Jiao Tong de Shanghai auquel appartient son groupe de recherche est connu sous le nom de Laboratoire d'intelligence linguistique cross-média de l'Université Jiao Tong de Shanghai.Fondé en 2012, il s'appelait auparavant le Laboratoire de la Parole Intelligente (SpeechLab). Après des années de développement, il est devenu un « laboratoire d’intelligence linguistique intermodal » couvrant tous les domaines de recherche fondamentaux du traitement de l’information linguistique audiovisuelle.

Actuellement, le corps professoral du Cross-Media Language Intelligence Laboratory se compose d'un professeur, de quatre professeurs associés et d'un assistant de recherche, avec plus de 20 doctorants, plus de 30 étudiants en master et plus de 30 étudiants de premier cycle issus des cours ACM, des cours d'IA, des cours IEEE, des majeures en informatique de l'École de génie électrique, de l'Institut d'excellence de Paris, de l'Institut du Michigan, etc.
Le laboratoire a reçu le soutien de nombreux projets nationaux et d'entreprise, notamment le Programme national de recherche et développement clé et le Fonds d'excellence pour les jeunes scientifiques de la Fondation nationale des sciences naturelles de Chine. Le laboratoire a coopéré en profondeur avec AISpeech Technology Co., Ltd. pour établir le « Laboratoire conjoint d'interaction homme-machine intelligente AISpeech de l'Université Jiao Tong de Shanghai ». Le laboratoire peut mobiliser de riches ressources de données et des ressources de calcul abondantes allant jusqu'à des centaines de cartes GPU H800, A800, A10 et autres. C'est l'un des rares laboratoires d'intelligence artificielle au monde capable de mener des analyses et des recherches de données à grande échelle au niveau industriel.
Les étudiants ayant une formation en psychologie et un intérêt pour la santé mentale computationnelle sont invités à se joindre à la recherche.
Page d'accueil du laboratoire :