Die Agenten-Psychologische Klinik Ist Online! Basierend Auf 1,3.000 Depressionsberatungsdialogen Entwickelte Das Team Der Shanghai Jiaotong University Einen Großen Modelldialogagenten, Der Depressionen Diagnostizieren Kann

Psychische Gesundheitsprobleme sind eine der größten Herausforderungen für die heutige Gesellschaft. Laut dem World Mental Health Report der WHO leiden etwa 246 Millionen Menschen an depressiven Störungen, im Durchschnitt sind es 3.153 Fälle pro 100.000 Menschen. Man kann sagen, dass es sich hierbei um eine der häufigsten psychischen Störungen handelt.
Allerdings sind die Gesundheitsressourcen für die psychische Gesundheit auch heute noch unzureichend, insbesondere in Ländern mit niedrigem und mittlerem Einkommen. Darüber hinaus sind in allen Ländern und RegionenProfessionelle Ressourcen für die psychische Gesundheit sind vor allem in Städten und großen Einrichtungen konzentriert, was zu einem Ungleichgewicht bei der Verteilung der Krankenhausressourcen führt.Dies erschwert es Patienten mit psychischen Störungen wie Depressionen, rechtzeitig die entsprechende medizinische Hilfe zu erhalten.
Um die medizinischen Ressourcen besser zu verteilen und das Dilemma der Ressourcenknappheit zu lindern, sind effiziente und genaue automatisierte Methoden zur Depressionsdiagnose wichtig und von entscheidender Bedeutung. Unter den verschiedenen automatisierten Diagnosemethoden gelten Konversationsagenten aufgrund ihrer Kosteneffizienz, Zeitersparnis und Wahrung der Benutzeranonymität als sehr effektiv. Es ist erwähnenswert, dass im Verlauf des diagnostischen GesprächsDie Dialogstrategie des Agenten muss sich mit dem psychischen Zustand des Patienten und dem Verlauf der Arzt-Patienten-Beziehung ändern.Dies stellt zweifellos eine große Herausforderung für die Konstruktion von Dialogagenten dar.
Als Reaktion auf die oben genannten ProblemeDas Team von Professor Mengyue Wu vom X-LANCE-Labor der Shanghai Jiao Tong University hat zusammen mit der University of Texas at Arlington (UTA), dem Tianqiao Brain Science Institute (TCCI) und ThetaAI ein automatisiertes Dialogagenten-Simulationssystem mit großem Modell entwickelt – Agent Mental Clinic (AMC).Wird zur Erstdiagnose einer Depression verwendet. Dieses System kann gleichzeitig einen Psychiater und einen potentiellen Depressionspatienten simulieren und ein Depressionsberatungsgespräch simulieren. Um den Gesprächsverlauf zu optimieren und die Psychiater anzuleiten, hat AMC außerdem eine Ausbilderrolle entwickelt, die den Psychiatern Orientierung für die nächste Gesprächsrunde bietet. Alle Rollen im System können von echten Menschen gespielt oder durch große Modelle implementiert werden.
Um sich besser an die Anforderungen der Diagnoseumgebung anzupassen, verwendet AMC die Ideen der beliebten Konstruktion großer Modellagenten und schlägt außerdem eine dreischichtige Speicherstruktur und einen neuen Speicherabrufmechanismus vor, um eine effizientere und genauere Depressionsberatung und Erstuntersuchung zu erreichen. Dieses Dialogsystem kann nicht nur für die Voruntersuchung von Patienten mit potenzieller Depression verwendet werden, sondern kann auch zur Ausbildung von angehenden Psychiatern oder Studenten eingesetzt werden, indem es ihnen eine gewisse Anleitung und Unterstützung bietet, bevor sie offiziell zum Praktikum in die Abteilung eintreten. Auch die Ausbilderrolle, die professionelle Psychiater übernehmen können, liefert auf Basis des großen Modells umsetzbare Optimierungsideen für den Psychiater-Agenten.
Die zugehörige Forschung mit dem Titel „Depression Diagnosis Dialogue Simulation: Self-improving Psychiatrist with Tertiary Memory“ wurde als Vorabdruck veröffentlicht.
Forschungshighlights:
* Es wurde ein neuartiges Dialog-Agenten-Simulationssystem entwickelt, um das diagnostische Gespräch zwischen Patienten-Agent und Psychiater-Agent zu simulieren. Damit wird eine wirksame neue Methode für die Ausbildung angehender Psychiater und die Voruntersuchung potenzieller Depressionspatienten bereitgestellt.
* Schlagen Sie eine innovative dreischichtige Speicherstruktur und ein Modul zum Abrufen von Erinnerungen vor, um die Zusammenfassungsfähigkeiten des Agenten in der Diagnosephase zu verbessern und so eine neue Richtung für die Optimierung der Depressionsdiagnose und der Dialogsimulation in der Zukunft vorzugeben.
* Das AMC-System hat sowohl die Depressionsdiagnose als auch die Suizidvorhersage verbessert. Der Rahmen kann auf andere spezifische Bereiche angewendet werden und eignet sich für das Training mit begrenzten gekennzeichneten Fällen.

Papieradresse:
https://arxiv.org/abs/2409.15084
Das Open-Source-Projekt „awesome-ai4s“ vereint mehr als 100 AI4S-Papierinterpretationen und stellt umfangreiche Datensätze und Tools bereit:
https://github.com/hyperai/awesome-ai4s
D4 Von Fachärzten verifizierter Datensatz
D4 Der Datensatz wurde vom Team von Professor Wu Mengyue gesammelt und von professionellen Ärzten auf seine Qualität geprüft.Die Erfassung des Dialogdatensatzes erfolgt in drei Phasen:
* Verteilen Sie Fragebögen in sozialen Medien und auf anderen Plattformen, um persönliche Porträts von echten potenziellen Depressionspatienten zu sammeln und zu erstellen.
* Rekrutieren und schulen Sie Simulationspatienten und Simulationsärzte, stellen Sie den Simulationspatienten die gesammelten Porträts von Depressionspatienten zur Verfügung und lassen Sie die Simulationsärzte und Simulationspatienten anschließend einen Depressionsberatungsdialog führen.
* Die gesammelten simulierten Gespräche werden an professionelle Psychiater übergeben, um die Qualität der Beratungsgespräche zu überprüfen. Für die Gespräche, die den Qualitätsstandards entsprechen, wird eine Zusammenfassung des Schweregrads der Depression und der Symptome erstellt.

Nach der Erfassung und Überprüfung sammelte das Team von Professor Wu Mengyue insgesamt 1.339 Gespräche von zufriedenstellender Qualität für die Erstellung des Depressionsberatungsdatensatzes D4. Der Grad der Depression wurde in vier Hauptkategorien eingeteilt: keine (430 Gespräche), leichte (342 Gespräche), mittelschwere (368 Gespräche) und schwere (199 Gespräche), mit einer durchschnittlichen Anzahl von Gesprächsrunden von 21,6 Runden. Anschließend schlug das Team von Professor Wu Mengyue ein SEO-Annotationsframework zur Diagnose von Depressionssymptomen vor, um den D4-Datensatz zu annotieren.

Innovative dreischichtige Speicherstruktur und Speicherabrufmodul
Die Forscher schlugen ein automatisiertes Dialogagenten-Simulationssystem mit großem Modell vor, das über eine dreischichtige Speicherstruktur und einen neuen Speicherabrufmechanismus verfügt, der drei Module umfasst:
* Patientenvertreter:Der Patientenagent wird mithilfe von Benutzerinformationen initialisiert, die aus dem D4-Benutzerporträt und dem Depressionsberatungsdialog extrahiert wurden. AMC wählte 100 klassische Fälle aus D4 als Trainingssatz aus und verwendete GPT-4, um Ereignisinformationen aus dem medizinischen Konsultationsdialog als anfänglichen Gedächtnisknoten des Patienten zu extrahieren.
* Psychiater-Agent:Zur Initialisierung wurden die Beschreibung und die diagnostischen Grundlagen depressiver Störungen in ICD-11 verwendet und im Verlauf der Diagnose die elektronischen Krankenakten und zusammengefassten diagnostischen Fähigkeiten des Patienten gesammelt.
* Supervisor-Plugin:Es wird verwendet, um die Diagnoseergebnisse des Psychiater-Agenten mit denen des Patienten-Agenten zu vergleichen, die Erfahrungen zusammenzufassen und sie dem Psychiater-Agenten zur Speicherung zu übergeben.

Der Betriebsablauf des gesamten AMC-Systems ist in der Abbildung dargestellt und umfasst insgesamt 6 Schritte:
1. Initialisieren Sie eine Gruppe von Patientenagenten mithilfe von Patientenporträts, die von GPT-4 basierend auf den von D4 gesammelten Daten generiert wurden. Die Diagnoseergebnisse depressiver Störungen werden dem Patientenbetreuer im Rahmen der Patientenberatung nicht mitgeteilt. 2. Der Patientenvertreter und der Psychiatervertreter unterhalten sich über eine Depressionsberatung.
3. Im zweiten Schritt verfolgt das Instruktor-Plugin die vom Patienten genannten Symptome und unterbreitet dem Psychiater-Agenten je nach Gesprächsverlauf Vorschläge für den nächsten Gesprächsschritt.
4. Nach Abschluss des Konsultationsdialogs vergleicht das Instruktor-Plug-In die endgültige Diagnose des Psychiater-Agenten für den Patienten mit der in D4 gespeicherten tatsächlichen Diagnose des Arztes. 5. Das Instruktor-Plug-In fasst die dem Psychiateragenten auf Grundlage des Vergleichs der Diagnoseergebnisse bereitgestellten Anweisungen zusammen und stellt sie dem Psychiateragenten zur Verfügung.
6. Nach Abschluss eines Konsultationsprozesses ruft der Psychiater den nächsten Patienten zur Diagnose auf und wiederholt den Prozess.

Um angepasste Erinnerungen besser abrufen zu können, um Gespräche und Diagnosen zu verarbeiten,Die Forscher konstruierten eine dreischichtige Agenten-Gedächtnisarchitektur: Gesprächsverlauf, elektronische Krankenakten und Zusammenfassungsfähigkeiten.In:
* Diagnoseverlauf ist der Verlaufsdatensatz des aktuellen Dialogs;
* Elektronische Patientenakten (EMRs) sind Zusammenfassungen der Gespräche, die der psychiatrische Betreuer nach jeder Patientenkonsultation verfasst und die Beschwerden, Symptome und andere Ereignisinformationen des Patienten enthält.
* Diagnosefähigkeiten sind vom Lehrer-Plugin zusammengefasste und im Speicher des Psychiater-Agenten gespeicherte Leitmeinungen, die dazu beitragen, den Gesprächsverlauf und die Diagnosegenauigkeit zu optimieren.

Experimentelle Schlussfolgerung: Verbesserung der Genauigkeit der Diagnose von Depressionen und Selbstmordtendenzen
Um die Wirksamkeit von AMC zu bewerten, führten die Forscher zwei Versuchsreihen mit dem D4-Testsatz durch.
Eine Möglichkeit besteht darin, den Originaldialog von D4 als Konsultationsdialog zwischen dem Psychiater-Agenten und dem Patienten-Agenten zur Durchführung der Diagnose zu verwenden, um die Diagnosefähigkeit des Modells zu testen. Die zweite Möglichkeit besteht darin, eine Diagnose durch einen Dialog zwischen dem Psychiater-Agenten und dem Patienten-Agenten zu stellen, wobei die Rollenspielfähigkeit und die Diagnosefähigkeit des Agenten umfassend untersucht werden.
Die Forscher berechneten die diagnostische Genauigkeit von depressiven Störungen und Suizidalität getrennt (kategorisiert als keine, leichte, mittelschwere und schwere). Durch den Vergleich des AMC-Systems mit und ohne Speicher zeigen die Ergebnisse, dass sich die Gesamtleistung des Modells auf dem Testsatz verbessert hat.Die Wirksamkeit von AMC bei der Nutzung der hierarchischen Speicherarchitektur wurde nachgewiesen und sowohl die einfache Diagnose als auch der Dialog + Diagnose können bis zu einem gewissen Grad verbessert werden.

Um die Wirksamkeit der dreischichtigen Speicherstruktur weiter zu überprüfen,Die Forscher führten ein Ablationsexperiment durch und fanden heraus, dass das gleichzeitige Hinzufügen des Speichers für elektronische Krankenakten und Zusammenfassungsfähigkeiten zu einer stabilen Verbesserung der Genauigkeit des Modells führen könnte, was die Wirksamkeit der dreischichtigen Speicherstruktur beweist.

Um die Wirksamkeit des Lehrer-Plugins zu überprüfen,Die Forscher führten auch Ablationsexperimente an Plug-Ins durch. Experimente zeigen, dass das Instruktor-Plugin auch einen gewissen Verbesserungseffekt auf die Architektur des AMC-Systems hat.

Entdecken Sie die Geheimnisse des Klangs
In den letzten Jahren hat die KI leistungsstarke Funktionen bei der Diagnose und Behandlung verschiedener Krankheiten bewiesen, beispielsweise bei der sprachbasierten Erkennung von Atemwegs- und Magen-Darm-Erkrankungen. Allerdings sind die Fortschritte bei der Diagnose und Behandlung psychischer Erkrankungen aufgrund des Mangels an relevanten Daten hoher Qualität nur langsam vorangekommen. Der Grund hierfür liegt darin, dass die meisten Patienten mit psychischen Erkrankungen immer noch Schamgefühle hinsichtlich ihrer Krankheit empfinden und die entsprechenden Krankenakten die Privatsphäre der Patienten berühren. Daher ist es schwierig, einen umfangreichen Datensatz für das Training des KI-Modells zu erstellen.
Die Hauptforschungsrichtung der Forschungsgruppe von Wu Mengyue liegt in der Computerpsychiatrie und der pathologischen Sprachforschung im Bereich des Audioverständnisses.Der in der oben genannten Forschung verwendete D4-Datensatz ist der weltweit erste Open-Source-Datensatz für Beratungsdialoge zum Thema Depression, der klinischen Standards entspricht und von ihrem Team erstellt wurde. Er bietet eine solide Grundlage für entsprechende Forschung.
Erwähnenswert ist, dass Professor Wu Mengyue über umfangreiche persönliche Erfahrungen und einen Hintergrund in der psychoakustischen Forschung verfügt und sich der Kombination von KI und Forschung zur psychischen Gesundheit verschrieben hat. HyperAI hat ein ausführliches Interview mit Professor Wu Mengyue geführt.Klicken Sie hier, um den vollständigen Bericht anzuzeigen: Wu Mengyue von der Shanghai Jiao Tong University: Einsatz von Sprachintelligenztechnologie zur Ausgabe der ersten Diagnose und Behandlungsanweisung für psychische Erkrankungen.
Der Erstautor dieser Forschungsarbeit ist Lan Kunyao, ein Ph.D. Student im Fachbereich Informatik, Schule für elektronische Informations- und Elektrotechnik, Shanghai Jiao Tong University.Er schloss sein Studium an der Shanghai Jiao Tong University mit einem Bachelor in Informationssicherheit ab. Sein Hauptforschungsschwerpunkt ist das Dialogsystem zur Diagnose und Behandlung psychischer Erkrankungen. Er gewann den zweiten Preis beim Mathematical Medicine Technology and Application Innovation Competition 2023 und den ersten Preis beim 13. National College Student Information Security Competition.

Das X-LANCE-Labor der Shanghai Jiao Tong University, zu dem seine Forschungsgruppe gehört, ist als Shanghai Jiao Tong University Cross-Media Language Intelligence Laboratory bekannt.Das 2012 gegründete Unternehmen hieß früher Intelligent Speech Laboratory (SpeechLab). Nach Jahren der Entwicklung ist es zu einem „Cross-Modal Language Intelligence Laboratory“ geworden, das alle Kernforschungsbereiche der audiovisuellen Sprachinformationsverarbeitung abdeckt.

Derzeit besteht die Fakultät des Cross-Media Language Intelligence Laboratory aus 1 Professor, 4 außerordentlichen Professoren und 1 Forschungsassistenten mit mehr als 20 Doktoranden, mehr als 30 Masterstudenten und mehr als 30 Studenten aus ACM-Klassen, KI-Klassen, IEEE-Klassen, Informatik-Hauptfächern der School of Electrical Engineering, des Paris Institute of Excellence, des Michigan Institute usw.
Das Labor erhielt Unterstützung von zahlreichen nationalen und Unternehmensprojekten, darunter vom National Key R&D Program und dem Excellent Young Scientist Fund der National Natural Science Foundation of China. Das Labor hat eng mit AISpeech Technology Co., Ltd. zusammengearbeitet, um das „Shanghai Jiao Tong University AISpeech Intelligent Human-Computer Interaction Joint Laboratory“ zu gründen. Das Labor kann umfangreiche Datenressourcen und umfangreiche Rechenressourcen von bis zu Hunderten von H800-, A800-, A10- und anderen GPU-Karten mobilisieren. Es ist eines der wenigen Labore für künstliche Intelligenz weltweit, das groß angelegte Datenanalysen und Forschungen auf industriellem Niveau durchführen kann.
Studierende mit psychologischem Hintergrund und Interesse an computergestützter psychischer Gesundheit sind herzlich eingeladen, an der Forschung teilzunehmen.
Homepage des Labors: