Sonderausgabe Zum Frauentag | Wu Mengyue Von Der Shanghai Jiaotong University: Einsatz Von Sprachintelligenztechnologie Zur Ausgabe Der Ersten Diagnose Und Behandlungsanweisung Für Psychische Erkrankungen

Vom Geplapper der Kinder über die endlosen Geschichten der Jugend bis hin zum mittleren Alter hören wir die Sorgen und Ermahnungen der Eltern und Älteren sowie den ständigen Druck des Lebens. Wenn wir genau darüber nachdenken, sind die Erfahrungen und Erinnerungen jeder Lebensphase mit unterschiedlichen Klängen gefüllt. Das Zirpen der Zikaden im Sommer und der Lärm auf dem Basketballplatz sind Jugend, und die Seufzer am Abend und die Benachrichtigungstöne von Handynachrichten sind Wachstum. Genauso wie Menschen ihr Gehör nicht völlig abschalten können, selbst wenn sie ihre Ohren fest zuhalten oder geräuschunterdrückende Kopfhörer tragen, ist auch der Schall überall.
Aus physikalischer Sicht ist Schall eine Schallwelle, die durch die Vibration von Objekten erzeugt wird und durch das Medium Luft übertragen werden kann. Daher kann Schall nur in einer vollständig luftleeren Umgebung isoliert werden. Aus einer anderen Perspektive betrachtet ist Klang als Träger der Sprache nicht nur ein wichtiges Kommunikationsmedium, sondern auch ein Ventil für den Ausdruck von Emotionen. Mit der rasanten Entwicklung der KI werden Analysetechnologien und damit verbundene Fähigkeiten immer leistungsfähiger. Die ursprünglich in der Luft schwebenden Schallwellen sind inzwischen zu Daten geworden, die untersucht werden können und sogar den Gesundheitszustand des menschlichen Körpers widerspiegeln.
In den letzten Jahren hat sich die sprachbasierte Technologie zur Krankheitserkennung in den Bereichen Pneumologie, Kardiologie, Gastroenterologie usw. durchgesetzt.Im Vergleich dazu ist der Einsatz von Audio bei der Diagnose und Behandlung psychischer Erkrankungen gemischt:Es besteht die Sorge, dass ein ernsthafter Mangel an relevanten Audiodaten besteht (hauptsächlich aufgrund der hohen Privatsphäre, die psychische Erkrankungen mit sich bringen). Die gute Nachricht ist: Eine Online-Diagnose der Krankheit auf Audiobasis kann den Patienten helfen, ihre Schamgefühle in der ersten Diagnosephase zu lindern und schnellstmöglich festzustellen, ob sie krank sind.
Lu Lin, ein Akademiker der Chinesischen Akademie der Wissenschaften, erwähnte in einem Interview, dass bis Ende 2021 6,6 Millionen Patienten mit schweren psychischen Störungen in der nationalen Datenbank registriert waren.Die Zahl der behandelten Personen darf 20% nicht überschreiten.Um die niedrige Behandlungsrate psychischer Erkrankungen zu beheben, ist der konsequente Ausbau und die Förderung audioanalytischer Diagnosemethoden von großer Bedeutung.
Wu Mengyue, außerordentlicher Professor und Doktorvater am Institut für Informatik der Shanghai Jiao Tong University, hat ein Sprachintelligenzmodell zur Diagnose und Behandlung psychischer Erkrankungen veröffentlicht.Auf der Grundlage eines großen Sprachmodells haben wir die unterschiedlichen Rollen von Ärzten und Patienten simuliert und unter Beteiligung von Diagnostikern für psychische Erkrankungen den weltweit ersten Open-Source-Datensatz für Konsultationsdialoge bei Depressionen erstellt, der klinischen Standards entspricht.

Anlässlich des Internationalen Frauentags hatte HyperAI die Ehre, ein ausführliches Interview mit Frau Wu Mengyue zu führen und den Charme der Stimme und ihre wunderbare Reaktion mit KI besser zu verstehen. Gleichzeitig sahen wir auch, wie diese zielstrebige und freigeistige Frau von ihren Interessen ausging und nach und nach Erfolge in ihrem Berufsfeld erzielte.
Machen Sie weiterhin umsetzbare Forschung
Es gibt subtile Unterschiede im Stimmtrakt, in der Mundhöhle, in der Nasenhöhle usw. jedes Menschen, daher sind die Stimmabdrücke der Menschen so unterschiedlich wie Fingerabdrücke und Gesichter. Wu Mengyue interessiert sich seit ihrer Kindheit sehr für die einzigartige Art und Weise, wie Menschen miteinander sprechen. „Menschen an ihrer Stimme erkennen“ war im Alltag sozusagen die Leiter, die sie in die Welt des Audios führte.
Während ihres Grundstudiums studierte Wu Mengyue, die hochsensibel war und sich für Geräusche interessierte, Psychoakustik an der Beijing Normal University. Während dieser Zeit erkannte sie, wie wichtig es ist, physikalische akustische Eigenschaften zu nutzen, um Klangunterschiede auf technischer Ebene zu erklären.Und in der EndphaseZur Analyse der akustischen Daten wurde eine computergestützte Modellierung gewählt.

Wenn die ersten Versuche, im Rahmen ihres Studiums Audioanalyseforschung im Bereich der Psychoakustik zu betreiben, Wu Mengyues Herz berührt haben, dann dienten die beiden damit verbundenen Forschungsprojekte, mit denen sie während ihres Doktoratsstudiums in engen Kontakt kam, als Katalysator.
Während ihres Doktoratsstudiums kam eine ihrer Kommilitoninnen, die Stimmanalyseforschung zum Thema Schizophrenie durchführte, im Rahmen einer Feldforschung mit einer großen Zahl obdachloser Menschen mit Schizophrenie in Kontakt. Ein anderer Mitbewohner kam nach seinem Doktortitel in klinischer Psychologie in das Gefängnis von Melbourne, um bei den Gefangenen Beurteilungen der psychischen Erkrankungen durchzuführen und herauszufinden, ob ihr damit verbundenes kriminelles Verhalten durch eine psychische Erkrankung beeinflusst wurde.
Die Erfahrungen dieser beiden Klassenkameraden waren für Wu Mengyue eine tiefe Inspiration und ein großer Einfluss. Nach ihrer Rückkehr nach China begann sie, eingehendere Forschungen zur Diagnose und Behandlung psychischer Erkrankungen durchzuführen.
Sie sagte:Im Bereich der Phonetik sind Sprache und Sprechen tatsächlich äußere Manifestationen menschlicher Gehirnfunktionen. Unabhängig davon, ob es sich um emotionale Störungen oder kognitive Dysfunktionen handelt, hinterlassen sie letztendlich Spuren im sprachlichen Ausdruck.Mit anderen Worten: Im Audiomaterial können relevante Biomarker gefunden werden, um Menschen mit psychischen oder emotionalen Störungen effektiv und bequem zu untersuchen.

Wenn Menschen zögern, ob und wie sie eine medizinische Behandlung in Anspruch nehmen sollen, kann die Audioanalyse gewissermaßen zur ersten Checkliste bei der Diagnose einer psychischen Erkrankung werden und das Schamgefühl des Patienten bis zu einem gewissen Grad schwächen.
Die ganze Zeit,Wu Mengyue besteht darauf, „praktische Forschung zu betreiben“.Nach Abschluss seiner Promotion erhielt Wu Mengyue eine Einladung von Nuance Communications, einem Unternehmen für KI-Spracherkennung, sich auf der industriellen Seite mit der technischen Forschung und Implementierung der Mensch-Computer-Interaktion im Cockpit zu befassen. Später, in einem Gespräch mit Yu Kai, einem Professor an der Fakultät für Informatik und Ingenieurwesen der Jiaotong-Universität Shanghai, erkannte sie die Vorteile der wissenschaftlichen Forschung und die neuen Ideen zur Umsetzung von Ergebnissen innerhalb von Universitäten durch die Erfahrung von Professor Yu Kai und kehrte daraufhin aus der Industrie in die Wissenschaft zurück.
Wu Mengyue sagte offen:Ob an Hochschulen und Universitäten oder in der Industrie, die ursprüngliche Intention „Praxisforschung“ hat sich nie geändert.Während der Epidemie entwickelte das Forschungsteam eine praxisnahe und bedarfsgerechte Depressionsberatungs-App, die Studierende direkt nutzen können.
Bereichern Sie die Audioanalyse und überwinden Sie Probleme mit Datenknappheit
Nach seiner Rückkehr an die Universität wählte Wu Mengyue weiterhin die Forschungsrichtung der Audioanalyse und integrierte darin weitere KI-Technologien.Derzeit liegt der Hauptforschungsschwerpunkt seiner Forschungsgruppe in der Rich Audio Analysis, also im Allgemeinen in der gesamten Audioverarbeitung außer der Spracherkennung.
Wu Mengyue führte ein, dass Klang in drei Ebenen unterteilt werden kann:Eines ist, was die Leute sagen.Dies ist der Schwerpunkt der Spracherkennungsforschung.Der zweite Punkt ist die Art und Weise, wie Menschen sprechen.Das heißt, derselbe Satz kann auf viele verschiedene Arten ausgedrückt werden und unterschiedliche Bedeutungen haben, die dazu verwendet werden können, den Geisteszustand oder die kognitive Funktion einer Person zu erkennen.Der dritte Punkt ist das Verständnis von Umgebungsgeräuschen.Dies ist auch der Schlüssel dazu, Maschinen im Hinblick auf das Verständnis von Audiodaten dem Menschen ähnlicher zu machen. Das Obige stellt eine umfassende Audioanalyse dar, wobei die Spracherkennung derzeit relativ ausgereift ist, sodass ihr Forschungsschwerpunkt auf den beiden letztgenannten liegt.
Derzeit umfasst die Forschungsgruppe von Wu Mengyue mehr als 20 Studenten, die relevante Forschung in diesen beiden Richtungen betreiben – Computerpsychiatrie und pathologische Sprachforschung im Audioverständnis.

In Anwendungsszenarien, beispielsweise in einer Fahrumgebung, bezieht sich Spracherkennung auf das interaktive System, das Befehle passiv erkennt und entsprechende Steuerelemente ausführt. Ist eine aktive Interaktion möglich, kann die Stimmung oder Müdigkeit des Fahrers anhand seines Stimmklangs beurteilt und die Stimmung über Licht- oder Soundeffekte im Auto angepasst werden. Wenn die Maschine gleichzeitig erkennt, dass der Ton des Benutzers nicht gut ist, kann sie beim Antworten auf Anweisungen auch die Strategie und Denkweise synchron anpassen.
Während der Epidemie wurden beispielsweise Mikrofone eingesetzt, um die Umgebungsgeräusche beim Öffnen und Schließen von Türen zu erfassen und den Abwesenheits-/Zuhause-Status zu analysieren und zu bestimmen. Im Vergleich zur herkömmlichen Kameraüberwachung ist diese Methode hilfreicher beim Schutz der Privatsphäre und Sicherheit der Menschen.
Nach herkömmlicher Auffassung sollten Tondaten eine große Stichprobengröße aufweisen und äußerst umfangreich sein. Tatsächlich werden Daten jedoch zu einer großen Herausforderung, wenn es um die Diagnose und Behandlung von Krankheiten geht, insbesondere im Bereich der psychischen Erkrankungen. Einerseits ist es aufgrund der ärztlichen Schweigepflicht und des Schamgefühls der Patienten äußerst schwierig, Tonaufnahmen von psychologischen Beratungsgesprächen zu erhalten. Andererseits zeichnen manche Krankenhäuser oder Ärzte Konsultationen in Form von Gesprächen auf, es entstehen jedoch keine standardisierten Daten, die Audioqualität ist oft nicht hoch und aus Datenschutzgründen ist es oft nicht möglich, die Daten mit der Außenwelt zu teilen.
zu diesem Zweck,Wu Mengyue leitete das Forschungsteam bei der Erstellung des weltweit ersten Open-Source-Dialogdatensatzes für Depressionsberatungen, der klinischen Standards entspricht.Der erste Schritt besteht darin, eine langfristige und intensive Kommunikation mit Ärzten und Patienten im Zentrum für psychische Gesundheit zu führen, um den Konsultationsprozess und die Gesprächspunkte zu konsolidieren und dann die relevanten Inhalte in einem Dialogprozess mit einer Entscheidungsbaumstruktur zu organisieren und ihn wiederholt mit professionellen Ärzten zu überprüfen und anzupassen. Zweitens haben wir Arzt-Patienten-Dialoge durch Rollenspiele simuliert und schließlich professionelle Ärzte gebeten, die erhaltenen Daten zu sichten, um Daten zu erhalten, die eher klinischen Konsultationen entsprechen, und so diesen Open-Source-Datensatz zu erstellen.
Datensatzlink:https://x-lance.github.io/D4/
Ähnlich wie andere Wissenschaftler, die sich mit der Forschung zum Thema KI für die Wissenschaft beschäftigen, ist Wu Mengyues Hintergrund an der Schnittstelle zwischen Psychologie und Informatik in der Lage, bei der Förderung der KI-gestützten Diagnose und Behandlung psychischer Erkrankungen auf die tatsächlichen Schmerzpunkte aktueller Patienten einzugehen und Forschungsstrategien in Form simulierter Daten flexibel anzupassen, wenn die Forschung auf Herausforderungen stößt. Ein interdisziplinärer Hintergrund kann im Bereich der wissenschaftlichen Forschung oft zu innovativen Durchbrüchen führen und gleichzeitig für mehr Kreativität sorgen.

Angetrieben von Interesse können Sie Großes erreichen
Im Interview mit Wu Mengyue hörte der Autor mehrmals das Wort „Interesse“ – die Konzentration auf die Audioforschung basiert auf Interesse; Sie interessiert sich für Forschung im Zusammenhang mit der Diagnose psychischer Erkrankungen. der Wechsel in die Informatikabteilung erfolgt nicht aus Trendperspektive, sondern aus Eigeninteresse; und sie hofft auch, den Interessen der Studenten in der Forschungsgruppe Priorität einzuräumen …
Es lässt sich nicht leugnen, dass „Interesse“ ein nährstoffreicherer Boden ist, egal ob es sich um anspruchsvolle akademische Forschung oder hektisches Arbeiten am Arbeitsplatz handelt. Wird es bereits in der Kindheit gesät, ist die treibende Kraft für ein positives Wachstum stärker. Während Professor Wu Mengyue sich an ihren Interessen orientiert, lässt sie nicht nach, obwohl sie „Buddhistin“ ist. Ob es sich nun um die Anhäufung wissenschaftlicher Forschung in der Häufigkeit von Veröffentlichungen handelt oder um die praktische Anwendung der Integration von Industrie und Forschung, sie alle sind ein starker Beweis für ihre Praxis der „praktischen Forschung“.

In den letzten Jahren sind immer mehr weibliche Kräfte in den Bereichen Wissenschaft und Technologie sowie wissenschaftliche Forschung aktiv geworden und haben revolutionäre Innovationen hervorgebracht, die die Welt in Erstaunen versetzt haben. Auch der Frauenfonds der Vereinten Nationen hat den diesjährigen Internationalen Frauentag unter das Motto „Investieren in Frauen: Den Fortschritt beschleunigen“ gestellt, was in gewissem Maße die wichtige Rolle der Frauen im gesellschaftlichen Prozess hervorhebt.
Auch wenn der Autor die Unterschiede zwischen den Geschlechtern nicht zu sehr betonen möchte, besteht im realen sozialen Umfeld durchaus ein Druck. Aber wie Wu Mengyue sagte: „Konzentrieren Sie sich auf das Glück und gehen Sie von Ihren Interessen aus.“ Gerade wenn die Erwartungen der Außenwelt an Frauen nicht allzu hoch sind, bedeutet das, dass es tatsächlich nicht zu viele Einschränkungen gibt. Vielleicht bietet es Raum zum Wachsen, um Kraft zu sammeln und zu explodieren, wenn sich die Gelegenheit ergibt.
Abschließend wünsche ich an diesem besonderen Tag, dass alle Frauen wie Lehrer Wu Mengyue sein können, ihre Interessen weiterentwickeln, selbstbewusst Nährstoffe aufnehmen und ein wundervolleres und freieres Leben führen können!