HyperAI超神経

うつ病の初期スクリーニングにご協力ください!上海交通大学のチームがエージェント心理クリニックを構築 この論文の最初の論文はデモとしてオンラインで公開され、技術的なハイライトが共有されています。

特色图像

「私は何度も彼女を殴り、首をつねり、コーナーに押し込んだこともありました。彼女を殴るたびに、私は後悔するでしょう。なぜ彼女を殴ったのですか?なぜ自分を制御できなかったのですか?私はただのろくでなしですか?狂人で極悪人だけど、どうしたらいいのか本当に分からない。」18歳のハオランさんは監視カメラに向かってこう言った。

今年8月、CCTVニュースの「相対性」記者である荘生春氏は、10代の若者のうつ病の実態について詳細な調査を実施したが、ハオランさんは自らの体験を語ろうとする数少ない10代のうつ病患者の一人だった。カメラに直接。

「中国青少年発展報告書」によると、現在、17歳以下の約3,000万人の子どもや青少年がさまざまな感情障害や行動上の問題に苦しんでいるという。青少年は不安定な時期にあり、比較的心理的に脆弱です。問題が特定され、適切な時期に介入されなければ、さらに精神疾患に発展します。しかし、現在、精神保健医療資源は大幅に不足しており、そのほとんどが都市や大規模な医療機関に集中しているため、多くのうつ病患者がタイムリーに医療支援を受けることが困難となっています。

これに関して、上海交通大学 X-LANCE 研究室のウー メンユエ教授のチームは、テキサス大学アーリントン校 (UTA)、天橋脳研究所 (TCCI)、ThetaAI Company と協力しました。自動大規模モデル対話エージェント シミュレーション システム - エージェント メンタル クリニック (AMC) - は、うつ病の予備診断のために構築されました。

4 回目の Meet AI4S ライブ ブロードキャストでは、HyperAI Super Neural が、この研究論文の筆頭著者である上海交通大学クロスメディア言語知能研究所の Lan Kunyao 博士を招待しました。「大型モデルエージェントによるメンタルヘルス相談・相談プラットフォーム」と題し、同プラットフォームの利用手順や技術的なハイライト、今後の計画などについて詳しく紹介した。

ロールプレイングをベースにエージェント心理クリニックの模擬相談に参加

以前は、入学時や就職時にメンタルヘルス検査を行うなど、さらなる医療リソースの支援が必要かどうかを判断するために自己評価フォーム(PHQ9、HAM-Dなど)をよく使用していました。自己評価フォームへの無差別な記入を避けるため、一貫性を確保するために多くの質問が繰り返し行われます。これにより、作業負荷が 2 倍になり、ユーザーは退屈に感じるといういくつかの問題が発生します。

PHQ9 自己評価フォーム

今では、人間とコンピュータの対話、つまり会話ロボットとチャットして相談プロセスをシミュレートするという助けを借りて、医師と患者のコミュニケーションはますます面白くなり、大規模な言語モデルの開発により、会話エクスペリエンスも常に向上しています。

Wu Mengyue 教授のチームが提案したインテリジェント心理クリニック AMC は、うつ病の予備診断に使用できます。その主な形式は、劇場公演をシミュレートし、ロールプレイングに似たタスクを実行することです。このプロセス中に、ユーザーは仮想俳優 NPC と会話して相談プロセスを促進できます。具体的には、研究者らは主に、患者エージェント、精神科医エージェント、インストラクターエージェントの3つの「役割」を設定した。

ユーザーは、これら 3 つの役割のいずれかを選択して体験できます。

これら 3 つのエージェントの詳細は次のとおりです。

* 患者エージェントは感情的に混乱しています。自分が病気に罹患しているかどうかを確認し、さらなる治療が必要かどうかを判断するには医師を見つける必要があります。研究者らはそれにさまざまなユーザーペルソナを与え、さまざまな問題に直面し、さまざまな年齢層のさまざまな患者をシミュレートできるようにしました。

ユーザーのポートレート

具体的には、研究者らは D と呼ばれるツールを使用しました。 データセット、つまり、性別、職業、主な訴え、年齢などの情報を網羅した、潜在的な患者の一連のポートレートがソーシャル メディアや公開プラットフォームを通じて募集され、これらのポートレートが厳密にレビューおよび検証された後、患者のシミュレーションに使用されます。模擬患者と模擬医師を採用して訓練し、双方が模擬診察の会話を行います。専門の心理学者は、これらの会話の質を評価して、実際の医師と患者のコミュニケーションのシナリオと一致していることを確認します。一致している場合、専門の医師は、患者のうつ病と自傷行為の傾向をさらに判断します。バリアフリー、軽度、中等度、重度。

*D4 これは、臨床基準を満たす世界初のオープンソースのうつ病相談会話データセットです。
データセットアドレス:https://x-lance.github.io/D4/

コレクトD4 データセット

患者エージェントを初期化する際、研究者は上記の相談結果を患者エージェントに提供しますが、データ漏洩を避けるため、うつ病傾向や自傷行為傾向の具体的な値は患者エージェントに通知しません。さらに、患者エージェントの症状は通常、食事、睡眠、気分、興味、体調などに現れますが、この情報だけでは患者を完全に説明するのに十分ではありません。また、患者は生活、仕事、勉強においてプレッシャーにも直面しています。これらの要因は通常、特定の病気ではなく会話に反映されます。

この目的を達成するために、研究者らは GPT-4 を使用して会話の内容を分析し、その出来事に関連する記憶の断片を見つけ出し、これらの記憶を患者エージェントの記憶モジュールに統合することを選択しました。たとえば、夫婦の裏切りや人生の挫折に関する情報などです。仕事や勉強など。

※精神科医エージェントは、相談経験のない新人医師を対象としています。目的は、医師が患者とのコミュニケーションを大幅に改善できるかどうかをテストすることです。

医師側では、エージェントには初期段階で多くの実務経験が与えられませんが、研究者は初期記憶の一部として、単発性うつ病性障害や再発性うつ病性障害のテキスト説明など、いくつかの基本的な専門的情報を提供します。医師エージェントの。患者とのやり取りが増えれば増えるほど、ドクターエージェントのスキルや経験が蓄積され、診察レベルが向上していきます。

* インストラクター エージェントの主な目的は、医師と患者の対話プロセスを制御することです。際限なく続く会話は避けてください。将来的には、親子やカップルが共同カウンセリングを行っている場合など、家族カウンセリングのシナリオに拡張された場合、複数のエージェント間のやり取りによって衝突が生じる可能性があり、インストラクターエージェントが会話プロセスの調整に役立つ可能性があります。

相談の過程で、まず医師が質問し、患者が答え、次にインストラクターが患者の答えを追跡し、病気の症状を記録します。インストラクターは、患者の症状とICD-11やDSM-5などの標準検査とのギャップを比較した後、解明されていない問題点を指摘し、医師に次の質問のステップを指導します。医師はこれらの指示に基づいて患者に新たな質問をし、体内循環プロセスを形成します。各セッションの後、医師は患者のうつ病や自傷行為の傾向を評価します。

エージェント心理クリニックの構造

インストラクターはこれらの評価結果を受け取り、D 評価結果と比較します。4 データセットに保存されている実際の医師の診断結果を比較します。会話履歴や診断結果の違いをもとに、言語表現や質問方法、診断精度など、診察中の医師のパフォーマンスを指導者が評価し、振り返りによって得た記憶を医師の診断技術に蓄積します。医師エージェントが診察プロセス中により多くの経験と成長を得るのを支援します。

会話や診断を処理するための適応記憶をより適切に検索するために、研究者らは革新的な 3 層の記憶構造と記憶検索モジュール、つまり会話履歴、電子医療記録、要約スキルも提案したことは言及する価値があります。

プラットフォームは引き続き最適化されており、将来は有望です

ロールプレイングのプロセス中に、研究者たちはいくつかの問題にも遭遇しましたが、将来的にはそれらを最適化する予定です。

まず、幻覚の問題があります。つまり、モデルは会話内の事実と矛盾する応答を生成します。これは、すべての大規模モデルに共通する問題です。たとえば、過去 1 か月間、患者は自傷行為を考えていたにもかかわらず、それを実行しなかった可能性がありますが、モデルは患者が毎月自傷行為を行っていると誤って回答する可能性があります。この誤検知は長期的にはより明らかになります。会話。幻覚現象に対処するために、同様の問題が発生した場合、研究者はユーザーのポートレート内のいくつかの主要な症状をプロンプトとして使用し、モデルにさらなるプロンプトを提供します。ただし、このアプローチでは幻覚現象を一時停止することができるだけであり、さらなる取り組みはまだ残っています。将来的に必要となります。

もう一つの問題は言語スタイルです。患者は、最初に病院を訪れたときに自分の状態を説明するのに専門用語を使用しないことがよくありますが、モデルでは「神経運動遅滞」などの専門用語を使用する傾向があり、これは初診時の患者のパフォーマンスと一致しません。

言語スタイルの場合、反復の場合

さらに研究者らは、モデルが繰り返し質問をしていることも観察しました。たとえば、過去の歴史的な対話の影響で、モデルの冒頭と最後の発言は比較的固定されており、質問方法も比較的一貫しています。しかし、実際の会話ではこれらの要素が変化する可能性があり、その反応も多様です。会話を退屈させないように適切な快適さをどのように提供するかも、今後の検討課題です。

上記のコンテンツを最適化する際に直面する主な問題は、一貫性のない評価基準とプロの現場のデータセットの不足です。昨年5月、Wu Mengyue教授のチームのChen Siyuan博士は、大規模な言語モデルに基づいて医師と患者の対話をシミュレートした研究結果により、プロンプトを修正することで、大規模なモデルには人間の言語とは明らかな違いがあることが判明しました。モデルがこの症状を部分的に軽減できることを示唆しました。

陳思源氏の研究成果

評価基準の不一致の問題については、「質の高い対話」については一般的に誰もが理解していることですが、「中程度の対話」と「低品質の対話」の評価基準には大きな違いがある、これは主観的な誤りである可能性があります。個々の評価に依存するため、より大規模な人体テストが必要です。また、多くの研究では GPT-4 などの高品質なモデルを使用して他のモデルを評価していますが、大規模なモデルは解釈可能性が比較的弱く、人間の評価者の質と量も限られています。大規模な自動評価基準がまだ不足しています。

さらに、さまざまなアプリケーション シナリオに必要なデータ セットは異なります。特にプロフェッショナル シナリオでは、利用可能なサンプル サイズが小さいことが多く、テストの信頼性に影響を与え、大規模なモデルのトレーニングも制限される可能性があります。この点に関して、Lan Kunyao 氏は、将来の解決策の 1 つは、ロールプレイングの実践に心理的認知モデルの概念を導入することであると考えています。さまざまなシナリオに適応し、既存のネットワーク リソースをこのモデルに効果的にマッピングするためのより一般的な認知モデルを確立できれば、その後のトレーニング セットやテスト セットの取得が容易になります。これは検討する価値のある方向性です。

「私にとって、私が常にさらに探究したいと思っているのは、これらの確率モデルが最終的に性格についての完全で独立した考え方を形成できるかどうかです。大規模な言語モデルに固有の性格特性を評価するためのより安定した方法を見つけたいと思っています。」Lan Kunyao 氏の意見では、これらのモデルは大量のユーザー コーパスとユーザー データを学習しているため、理論的には性格特性を示すことができるはずであり、これに基づいて議論する必要があるのは、モデルがそうであるかどうかを評価する方法であると述べています。はこの能力を持っており、それが質問への回答、認知プロセス、ユーザーのニーズ (心理的快適さなど) への応答にどのような影響を与えるかについて説明します。 「モデルの性格特性や性格モジュールを見つけて区別できれば、モデルをさまざまなシナリオやニーズに適応させ、さまざまなタスクを実行できます。これは、迅速な調整のみに依存するよりも効果的です。」

テクノロジーを使って世界を変える

「学部ではグラフィックスの分野を専攻していました。大学院では徐々に自然言語処理に興味を持つようになりました。当時の私の研究の方向性はスマートエデュケーションでした。この時期、学生の個別化された学習に関する課題に直面しました。」その後、生徒たちの学びのパートナーとなる過程で、学生たちは学業上の助けだけでなく、心理的なサポートも必要としていることがわかりました。そこで私は、心理学分野でより深い探求をしたいと考え、博士課程の在学中にウー・メンユエ教授のチームに加わりました。 「大規模なエージェント心理クリニックを建設する当初の目的について話したとき、ラン・クンヤオ博士はこう言いました。

ウー・メンユエ教授は、心理学とコンピューターサイエンスの学際的な背景を持つ数少ない専門家の一人であり、AI を活用した精神疾患の診断と治療を推進する過程で、患者の実際のニーズを正確に把握し、研究戦略を柔軟に調整することができます。

彼女が勤務する上海交通大学クロスメディア言語知能研究室(X-LANCE)は、現在「クロスモーダル言語知能研究室」となり、視聴覚言語情報処理の中核研究領域をカバーし、材料化学分野もカバーしています。 。研究チームは、世界を変えることができるトップレベルの技術研究に取り組むことに取り組んでいます。「テクノロジーを使って世界を変えるには、まず優秀なエンジニアでなければならず、優秀なエンジニアは科学者でなければならない」というものです。
研究室ホームページ:https://x-lance.sjtu.edu.cn

チーム写真

同研究所は、国家重点研究開発プログラムや中国自然科学財団優秀青少年科学基金など、多くの国家および企業のプロジェクトから支援を受けており、Spichi Technology Co., Ltd.とも深く協力し、「上海交通」を設立した。通大学スピチ智能科技有限公司の「ヒューマンコンピュータインタラクション共同研究室」は、豊富なデータリソースと、H800、A800、A10など数百枚のGPUカードを含む多数のコンピューティングリソースを備えた数少ない研究室の1つです。産業レベルの大規模なデータ分析や研究を行うことができる世界の人工知能研究所の一つ。