HyperAI

Helfen Sie Beim Erstscreening Einer Depression! Das Team Der Shanghai Jiao Tong University Baut Eine Psychologische Klinik Für Agenten Auf. Der Erste Artikel Des Artikels Wird Online Als Demo Präsentiert Und Teilt Technische Highlights.

特色图像

Ich habe sie geschlagen, ihr sogar den Hals zugedrückt und sie mehrmals in die Ecke gedrängt. Jedes Mal, wenn ich das tat, bereute ich es. Warum habe ich sie geschlagen? Warum konnte ich mich nicht beherrschen? Bin ich ein Mistkerl, ein Verrückter oder ein unverzeihlicher Mensch? Aber ich weiß wirklich nicht, was ich tun soll.Dies sagte der 18-jährige Haoran vor der Überwachungskamera.

Im August dieses Jahres führte Zhuang Shengchun, Reporter von CCTV News „Relativity“, eine eingehende Untersuchung zur tatsächlichen Situation von Depressionen bei Teenagern durch. Haoran war einer der wenigen Teenager, die an Depressionen litten und bereit waren, vor die Kamera zu treten und seine Geschichte zu erzählen.

Heutzutage treten Depressionen immer häufiger auf. Laut dem „China Youth Development Report“ leiden etwa 30 Millionen Kinder und Jugendliche unter 17 Jahren an verschiedenen emotionalen Störungen und Verhaltensproblemen. Jugendliche befinden sich in einem turbulenten Alter und sind psychisch relativ anfällig. Wird das Problem nicht rechtzeitig erkannt und eingegriffen, kann es sich zu einer psychischen Erkrankung entwickeln. Allerdings besteht derzeit ein deutlicher Mangel an medizinischen Ressourcen im Bereich der psychischen Gesundheit, und die meisten Ressourcen sind in Städten und großen medizinischen Einrichtungen konzentriert. Diese ungleiche Verteilung macht es für viele Patienten mit Depressionen schwierig, rechtzeitig medizinische Hilfe zu erhalten.

Als Reaktion darauf arbeitete das Team von Professor Wu Mengyue vom X-LANCE-Labor der Shanghai Jiao Tong University mit der University of Texas in Arlington (UTA), dem Tianqiao Brain Science Institute (TCCI) und ThetaAI zusammen.Zur vorläufigen Diagnose von Depressionen wurde ein automatisiertes Dialog-Agenten-Simulationssystem mit großem Modell, die Agent Mental Clinic (AMC), entwickelt.

In der vierten Live-Übertragung von Meet AI4S lud HyperAI den Erstautor dieses Forschungspapiers, Dr. Lan Kunyao vom Cross-Media Language Intelligence Laboratory der Shanghai Jiao Tong University, ein.Unter dem Motto „Plattform für die Diagnose und Beratung psychischer Erkrankungen basierend auf einem Big Model Agent“ stellte er detailliert die Nutzungsschritte, technischen Highlights und Zukunftspläne der Plattform vor.

Nehmen Sie an einer simulierten Beratung in der Agent Psychology Clinic teil, die auf Rollenspielen basiert

In der Vergangenheit haben wir häufig Selbsteinschätzungsformulare (wie PHQ9, HAM-D) verwendet, um festzustellen, ob wir weitere medizinische Ressourcen benötigten, wie etwa die Teilnahme an Tests zur psychischen Gesundheit bei der Einschulung oder bei der Arbeitsaufnahme. Sie werden feststellen, dass viele Fragen im Selbstbewertungsformular wiederholt gestellt werden, um ein zufälliges Ausfüllen des Formulars zu verhindern und so die Konsistenz zu gewährleisten. Dies führt zu einer Reihe von Problemen: Der Arbeitsaufwand verdoppelt sich und die Benutzer finden es langweilig.

PHQ9-Selbsttestformular

Mithilfe der Mensch-Computer-Interaktion, also dem Chatten mit einem Dialogroboter, um den Beratungsprozess zu simulieren,Die Arzt-Patienten-Kommunikation ist interessanter geworden und mit der Entwicklung großer Sprachmodelle verbessert sich das Gesprächserlebnis ständig.

Die vom Team um Professor Wu Mengyue vorgeschlagene Intelligent Psychological Clinic (AMC) kann zur vorläufigen Diagnose einer Depression verwendet werden. Seine Hauptform besteht darin, eine Theateraufführung zu simulieren und rollenspielähnliche Aufgaben durchzuführen. Während dieses Prozesses können Benutzer mit virtuellen Akteur-NPCs kommunizieren, um den Konsultationsprozess voranzutreiben. Speziell,Die Forscher haben im Wesentlichen drei „Rollen“ eingerichtet: Patientenagent, Psychiateragent und Ausbilderagent.

Benutzer können eine dieser drei Rollen auswählen, um Erfahrungen zu sammeln.

Die detaillierten Informationen zu diesen drei Agenten lauten wie folgt:

* Der geduldige Agent ist emotional verwirrt.Um festzustellen, ob bei Ihnen eine Krankheit vorliegt und ob eine weitere Behandlung erforderlich ist, müssen Sie einen Arzt aufsuchen. Die Forscher erstellten verschiedene Benutzerprofile, sodass mehrere unterschiedliche Patienten simuliert werden konnten, die möglicherweise mit unterschiedlichen Problemen konfrontiert waren und unterschiedlichen Altersgruppen angehörten.

Benutzerprofil

Konkret verwendeten die Forscher eine Technik namens D Datensätze,Das heißt, über soziale Medien oder öffentliche Plattformen wurde eine Gruppe potenzieller Patienten mit Porträts rekrutiert, die Informationen wie Geschlecht, Beruf, Hauptanforderungen und Alter umfassten. Diese Porträts wurden vor ihrer Verwendung zur Patientensimulation streng geprüft und verifiziert. Rekrutieren und schulen Sie Simulationspatienten und Simulationsärzte, und beide Parteien führen simulierte Beratungsgespräche. Professionelle Psychologen bewerten die Qualität dieser Gespräche, um sicherzustellen, dass sie realen Szenarien der Arzt-Patienten-Kommunikation entsprechen. Wenn dies der Fall ist, werden die Fachärzte die depressiven und selbstverletzenden Tendenzen des Patienten genauer untersuchen. Diese Diagnosen werden in vier Kategorien unterteilt: keine Barriere, leicht, mittelschwer und schwer.

*D4 Es handelt sich um den weltweit ersten Open-Source-Datensatz für Beratungsdialoge zu Depressionen, der klinischen Standards entspricht.
Datensatzadresse:https://x-lance.github.io/D4/

Sammle D4 Datensatz

Bei der Initialisierung des Patientenagenten stellen die Forscher dem Patientenagenten die oben genannten Ergebnisse des medizinischen Interviews zur Verfügung, informieren den Patientenagenten jedoch nicht über die spezifischen Werte der Depressionstendenz und der Selbstverletzungstendenz, um Datenlecks zu vermeiden. Darüber hinaus äußern sich die Symptome des Patienten üblicherweise in Ernährung, Schlaf, Stimmung, Interessen, körperlicher Verfassung usw., diese Informationen reichen jedoch nicht aus, um den Patienten vollständig zu beschreiben. Sie sind auch im Leben, bei der Arbeit und im Studium Druck ausgesetzt. Diese Faktoren spiegeln sich im Gespräch meist eher wider als die konkreten Symptome.

Zu diesem Zweck entschieden sich die Forscher, GPT-4 zu verwenden, um den Inhalt des Gesprächs zu analysieren und die Erinnerungsfragmente herauszufinden, die mit dem Ereignis in Zusammenhang stehen. Diese Erinnerungen, wie etwa Informationen über Ehebruch, Rückschläge bei der Arbeit und beim Studium usw., sollten dann in das Gedächtnismodul des Patienten-Agenten integriert werden.

* Der Psychiater-Agent ist in der Situation eines neuen Arztes ohne Konsultationserfahrung.Ziel ist es zu testen, ob der Arzt in der Patientenkommunikation deutliche Fortschritte erzielen kann.

Auf der Arztseite wird dem Agenten in der Anfangsphase nicht viel praktische Erfahrung vermittelt, aber die Forscher werden einige grundlegende professionelle Informationen bereitstellen, wie etwa Textbeschreibungen von einmaligen depressiven Störungen und wiederkehrenden depressiven Störungen, als Teil der anfänglichen Erinnerung des Agenten des Arztes. Mit der zunehmenden Anzahl von Interaktionen mit Patienten werden sich die Fähigkeiten und Erfahrungen des Arztvertreters weiter vertiefen, wodurch sich die Qualität der Beratung verbessert.

* Der Hauptzweck des Instruktor-Agenten besteht darin, den Ablauf des Arzt-Patienten-Dialogs zu steuern.Vermeiden Sie Gespräche, die sich endlos hinziehen. Wenn die Methode künftig auf Familienberatungsszenarien ausgeweitet wird, beispielsweise wenn Eltern und Kinder oder Paare gemeinsam beraten, kann die Interaktion zwischen mehreren Agenten zu Konflikten führen und der anleitende Agent kann bei der Koordinierung des Gesprächsprozesses helfen.

Während des KonsultationsprozessesDer Arzt stellt Fragen, der Patient antwortet und der Ausbilder verfolgt die Antworten des Patienten und zeichnet die Krankheitssymptome auf. Nach dem Vergleich der Symptome des Patienten mit Standardtests wie ICD-11 und DSM-5 weist der Dozent darauf hin, welche Probleme noch nicht gelöst sind, und gibt dem Arzt Hinweise zu den nächsten Fragen. Auf Grundlage dieser Anweisungen stellen die Ärzte den Patienten neue Fragen, wodurch ein innerer Kreislauf entsteht. Am Ende jedes Gesprächs wird der Arzt die depressiven und selbstverletzenden Tendenzen des Patienten beurteilen.

Agent Psychologie Klinik Architektur

Der Dozent erhält diese Bewertungsergebnisse und vergleicht sie mit den D4 Die Daten werden mit den im Datensatz gespeicherten tatsächlichen Diagnoseergebnissen des Arztes verglichen. Anhand der Unterschiede zwischen Gesprächsverlauf und Diagnoseergebnis beurteilt der Dozent die Leistung des Arztes im Gespräch, insbesondere hinsichtlich Sprachausdruck, Fragetechnik und diagnostischer Genauigkeit. Schließlich speichert der Ausbilder die reflektierten Erinnerungen in den Diagnosefähigkeiten des Arztes, um dem Arzt zu helfen, mehr Erfahrung zu sammeln und während des Konsultationsprozesses zu wachsen.

Es ist erwähnenswert, dass die Forscher, um das adaptive Gedächtnis zur Verarbeitung von Gesprächen und Diagnosen besser abrufen zu können, auch eine innovative dreischichtige Gedächtnisstruktur und ein Gedächtnisabrufmodul vorgeschlagen haben, nämlich Gesprächsverlauf, elektronische Krankenakten und Zusammenfassungsfähigkeiten.

Die Plattform wird weiter optimiert und die Zukunft ist vielversprechend

Während des Rollenspielprozesses stießen die Forscher auch auf einige Probleme und werden diese in Zukunft optimieren.

Erstens gibt es das Problem der Halluzinationen.Das heißt, das Modell erzeugt im Gespräch Antworten, die nicht mit den Fakten übereinstimmen. Dies ist ein allgemeines Problem bei allen großen Modellen. Beispielsweise kann ein Patient im letzten Monat Gedanken an Selbstverletzung gehabt haben, diese aber nicht in die Tat umgesetzt haben. Dennoch kann das Modell fälschlicherweise antworten, dass der Patient jeden Monat selbstverletzendes Verhalten an den Tag legt. Dieses falsche Positiv ist bei langen Gesprächen deutlicher. Um das Halluzinationsphänomen zu bewältigen, verwendeten die Forscher bei ähnlichen Problemen einige Schlüsselsymptome in den Benutzerporträts als Aufforderungen, das Modell weiter zu motivieren. Dieser Ansatz kann das Halluzinationsphänomen jedoch nur vorübergehend lindern, und in Zukunft sind noch weitere Anstrengungen erforderlich.

Ein weiteres Problem ist der Sprachstil.Während Patienten bei ihrem ersten Arztbesuch häufig keine Fachbegriffe verwenden, um ihren Zustand zu beschreiben, verwendet das Modell eher Fachbegriffe wie „neuromotorische Retardierung“, die nicht mit der Leistung des Patienten bei der ersten Konsultation übereinstimmen.

Sprachstilfälle, Wiederholungsfälle

Darüber hinaus stellten die Forscher fest, dass das Modell dazu neigte, Fragen wiederholt zu stellen.Beispielsweise sind die Eröffnungs- und Schlussbemerkungen des Modells, beeinflusst durch vergangene historische Gespräche, relativ festgelegt und auch die Art und Weise, wie Fragen gestellt werden, ist relativ konsistent. Aber in echten Gesprächen können sich diese Elemente ändern und auch die Antworten sind unterschiedlich. Auch die Frage, wie man für den entsprechenden Komfort sorgt, damit das Gespräch nicht langweilig wird, ist ein Problem, das in Zukunft berücksichtigt werden muss.

Die Hauptprobleme bei der Optimierung der oben genannten Inhalte sind inkonsistente Bewertungsstandards und der Mangel an professionellen Szenario-Datensätzen.Im Mai letzten Jahres simulierte Dr. Chen Siyuan aus dem Team von Professor Wu Mengyue Arzt-Patienten-Gespräche auf der Grundlage eines großen Sprachmodells. Die Forschungsergebnisse zeigten, dass das große Modell offensichtliche Unterschiede in Bezug auf die Begriffe im Vergleich zu menschlichen Begriffen aufweisen würde. Durch eine Änderung der Eingabeaufforderung und die Aufforderung an das Modell, umgangssprachliche Ausdrücke zu verwenden, kann dieses Symptom teilweise gelindert werden.

Chen Siyuans Forschungsergebnisse

Was das Problem inkonsistenter Bewertungsstandards betrifft, so haben die Menschen normalerweise ein allgemeines Verständnis von „hochwertigen Gesprächen“, aber es gibt erhebliche Unterschiede bei den Bewertungsstandards für Gespräche von „mittlerer“ und „schlechter Qualität“. Dies kann auf subjektive Fehler bei der individuellen Bewertung zurückzuführen sein, sodass Tests am Menschen in größerem Umfang erforderlich sind. Darüber hinaus verwenden viele Studien hochwertige Modelle wie GPT-4, um andere Modelle zu bewerten. Große Modelle sind jedoch Black Boxes mit relativ schwacher Interpretierbarkeit und die Qualität und Anzahl menschlicher Bewerter sind begrenzt. Daher fehlt es noch immer an einem großflächigen automatisierten Auswertungsstandard.

Darüber hinaus variieren die für unterschiedliche Anwendungsszenarien erforderlichen Datensätze. Insbesondere in professionellen Szenarien ist die verfügbare Stichprobengröße oft klein, was die Zuverlässigkeit des Tests beeinträchtigen und auch das Training großer Modelle einschränken kann. In dieser Hinsicht glaubt Lan Kunyao, dass eine zukünftige Lösung darin besteht, das Konzept des psychologischen kognitiven Modells in die Rollenspielpraxis einzuführen. Wenn es uns gelingt, ein allgemeineres kognitives Modell zu entwickeln, das sich an verschiedene Szenarien anpasst und vorhandene Netzwerkressourcen effektiv auf dieses Modell abbildet, wird es einfacher, nachfolgende Trainings- und Testsätze zu erhalten. Dies ist eine Richtung, die es wert ist, erkundet zu werden.

„Was ich schon immer weiter erforschen wollte, ist, ob diese Wahrscheinlichkeitsmodelle letztendlich ein vollständiges, unabhängiges Persönlichkeitsdenken bilden können, und ich hoffe, einen stabileren Weg zu finden, um die Persönlichkeitsmerkmale zu bewerten, die großen Sprachmodellen innewohnen.“Lan Kunyao sagte, dass diese Modelle seiner Meinung nach theoretisch in der Lage sein sollten, ein Persönlichkeitsmerkmal aufzuweisen, da sie eine große Menge an Benutzerkorpus und Benutzerdaten gelernt hätten. Auf dieser Grundlage muss diskutiert werden, wie beurteilt werden kann, ob das Modell über dieses Persönlichkeitsmerkmal verfügt und wie sich dieses Persönlichkeitsmerkmal auf seine Leistung beim Beantworten von Fragen, bei kognitiven Prozessen und beim Eingehen auf Benutzeranforderungen (wie etwa psychologisches Wohlbefinden) auswirkt. „Wenn wir die Persönlichkeitsmerkmale oder Persönlichkeitsmodule des Modells lokalisieren und unterscheiden können, können wir es an unterschiedliche Szenarien und Bedürfnisse anpassen und unterschiedliche Aufgaben ausführen. Das ist effektiver, als sich ausschließlich auf eine schnelle Feinabstimmung zu verlassen.“

Die Welt mit Technologie verändern

„Ich habe im Grundstudium Bildverarbeitung studiert und mich im Laufe meines Masterstudiums zunehmend für die Verarbeitung natürlicher Sprache interessiert. Mein Forschungsschwerpunkt lag damals auf intelligenter Bildung, und dabei stieß ich auf ein Thema im Zusammenhang mit den individuellen Lernbedürfnissen von Studierenden. Später, als ich einen Lernbegleiter für Studierende entwickelte,Ich habe festgestellt, dass Studierende nicht nur akademische Hilfe, sondern auch psychologische Unterstützung benötigen.Während meines Doktoratsstudiums schloss ich mich daher dem Team von Professor Wu Mengyue an, in der Hoffnung, tiefergehende Forschungen im Bereich der Psychologie durchführen zu können. „Dr. Lan Kunyao sagte dies, als er über die ursprüngliche Absicht sprach, eine groß angelegte Agenten-Psychologieklinik zu gründen.

Professor Wu Mengyue ist ein seltener Fachmann mit interdisziplinärem Hintergrund in Psychologie und Informatik. Im Zuge der Förderung der KI-gestützten Diagnose und Behandlung psychischer Erkrankungen kann sie genau auf die tatsächlichen Bedürfnisse der Patienten eingehen und Forschungsstrategien flexibel anpassen.

Das Cross Media Language Intelligence Lab (X-LANCE) der Shanghai Jiao Tong University, an dem sie arbeitet, wurde mittlerweile zum „Cross-Modal Language Intelligence Lab“ umbenannt und deckt die Kernforschungsbereiche der audiovisuellen Sprachinformationsverarbeitung ab und bezieht auch den Bereich der Materialchemie mit ein. Das Team hat sich der Durchführung erstklassiger technologischer Forschung verschrieben, die die Welt verändern kann. Das akademische Credo des Labors lautet: Um die Welt mit Technologie zu verändern, muss man zunächst ein hervorragender Ingenieur sein, und ein hervorragender Ingenieur muss ein Wissenschaftler sein.
Homepage des Labors:https://x-lance.sjtu.edu.cn

Teamfoto

Das Labor erhielt Unterstützung von zahlreichen nationalen und Unternehmensprojekten, darunter vom National Key R&D Program und dem Excellent Young Scientist Fund der National Natural Science Foundation of China. Darüber hinaus hat das Unternehmen eng mit AIS Technology Co., Ltd. zusammengearbeitet, um das „Shanghai Jiao Tong University AIS Intelligent Human-Computer Interaction Joint Laboratory“ zu gründen. Es verfügt über umfangreiche Datenressourcen und eine große Menge an Rechenressourcen, darunter Hunderte von H800-, A800- und A10-GPU-Karten. Es ist eines der wenigen Labore für künstliche Intelligenz weltweit, das groß angelegte Datenanalysen und Forschungen auf industriellem Niveau durchführen kann.