エージェント心理クリニックがオンラインになりました!上海交通大学のチームは、1.3Kのうつ病相談の会話に基づいて、うつ病を診断できる大規模なモデル対話エージェントを初めて構築した

メンタルヘルスの問題は今日の社会における最大の課題の1つです。WHOの世界メンタルヘルス報告書によると、約2億4,600万人がうつ病に罹患しており、人口10万人あたり平均3,153人が最も多いと言えます。よくある精神障害のひとつ。
しかし、メンタルヘルスのための医療資源は、特に低所得国および中所得国において、今日でも依然として不十分です。また、あらゆる国や地域において、精神保健専門の医療リソースは主に都市部や大規模施設に集中しており、その結果、病院のリソース配分に不均衡が生じています。このため、うつ病やその他の精神障害に苦しむ患者が適切な医療援助をタイムリーに受けることは困難になっています。
医療リソースをより適切に割り当て、リソース制約のジレンマを軽減するには、効率的かつ正確な自動うつ病診断方法が重要かつ重要です。さまざまな自動診断方法の中でも、会話型エージェントは、費用対効果が高く、時間の節約ができ、ユーザーの匿名性が維持できるため、非常に効果的であると考えられています。診断の会話が進むにつれて、エージェントの対話戦略は、患者の精神状態や医師と患者の関係の進展に応じて変更する必要があります。これは間違いなく、対話エージェントの構築に深刻な課題をもたらします。
上記の問題に対応して、上海交通大学 X-LANCE 研究室の Wu Mengyue 教師のチームは、UTA、Tianqiao Brain Institute (TCCI)、テキサス大学アーリントン校の ThetaAI Company と協力して、自動大規模モデル対話エージェント シミュレーション システム — AMC (エージェントメンタルクリニック)、うつ病の初期診断に。このシステムは、精神科医と潜在的なうつ病患者を同時にシミュレートし、うつ病相談の会話をシミュレートできます。さらに、対話プロセスを最適化し、精神科医を指導するために、AMC は精神科医に次の対話のガイダンスを提供するインストラクターの役割も設計しました。システム内のすべての役割は、実際の人物または大きなモデルが演じることができます。
診断環境のニーズによりよく適応するために、AMC は人気のある大型モデル エージェント構築のアイデアを使用し、さらに効率的かつ正確なうつ病診断と予備診断を実現するための 3 層メモリ ストレージ構造と新しいメモリ検索メカニズムを提案します。スクリーニング。この対話システムは、うつ病の可能性がある患者の事前スクリーニングに使用できるだけでなく、研修医や学生が研修のために正式に部門に入る前に何らかの指導や支援を提供できるように訓練するためにも使用できます。プロの精神科医が果たせるインストラクターの役割は、大規模なモデルに基づいて精神科医エージェントに実現可能な最適化アイデアを提供します。
関連する研究のタイトルは「うつ病診断対話シミュレーション:三次記憶を備えた自己改善精神科医」で、プレプリントが出版されている。
研究のハイライト:
* 新しい対話エージェント シミュレーション システムは、患者エージェントと精神科医エージェントの間の診断上の会話をシミュレートするために構築され、研修医の精神科医を訓練し、潜在的なうつ病患者を最初にスクリーニングするための効果的な新しい方法を提供します。
* 診断段階におけるエージェントの要約スキルを強化する革新的な 3 層の記憶構造と記憶検索モジュールを提案し、うつ病の診断と会話シミュレーションの将来の最適化に新しい方向性を提供します。
* AMC システムはうつ病の診断と自殺予測において改善されており、このフレームワークは他の特定の分野にも適用でき、限定されたラベル付き症例のトレーニングに適しています。

用紙のアドレス:
https://arxiv.org/abs/2409.15084
オープンソース プロジェクト「awesome-ai4s」は、100 を超える AI4S 論文の解釈をまとめ、大規模なデータ セットとツールを提供します。
https://github.com/hyperai/awesome-ai4s
D4 専門の医師によって検証されたデータセット
D4 データセットはウー・メンユエのチームによって収集され、専門の医師による品質検査に合格しました。会話データ セットの収集には 3 つの段階があります。
*ソーシャルメディアやその他のプラットフォームでアンケートを配布し、実際の潜在的なうつ病患者の個人像を収集し構築します。
* 模擬患者と模擬医師を募集して訓練し、集めたうつ病患者のポートレートを模擬患者に提供し、模擬医師と模擬患者がうつ病相談の会話を行えるようにします。
*収集した模擬会話を専門の精神科医に提出して、相談会話の質をチェックし、うつ病の重症度を診断し、適切な品質の会話の症状を要約します。

収集と検証の後、Wu Mengyue のチームは、うつ病相談データセット D4 を形成するための品質要件を満たす合計 1,339 件の対話を収集しました。うつ病の程度は、なし (対話 430 件)、軽度 (対話 342 件)、および中等度に分類されました。程度 (368 対話)、および重度 (199 対話) の 4 つのカテゴリーがあり、平均対話ラウンド数は 21.6 です。その後、Wu Mengyue 教師のチームは、D4 データセットに注釈を付けるための SEO うつ病症状診断注釈フレームワークを提案しました。

革新的な3層メモリ構造とメモリ検索モジュール
研究者らは、次の 3 つのモジュールを含む、3 層のメモリ ストレージ構造と新しいメモリ検索メカニズムを備えた自動大規模モデル対話エージェント シミュレーション システムを提案しました。
*患者エージェント:D4 ユーザーのポートレートとうつ病相談の会話に基づいて抽出されたユーザー情報を使用して、患者エージェントを初期化します。 AMC は D4 から 100 の古典的な症例をトレーニング セットとして選択し、GPT-4 を使用して患者の初期記憶ノードとして相談ダイアログ内のイベント情報を抽出しました。
* 精神科医エージェント:ICD-11 におけるうつ病性障害の記述と診断根拠は初期化に使用され、診断が進むにつれて患者の電子医療記録と要約された診断スキルが蓄積されます。
* スーパーバイザー プラグイン:精神科医エージェントによる患者エージェントの診断結果を比較し、経験を要約して精神科医エージェントに送信して保管するために使用されます。

AMC システム全体の動作プロセスを図に示します。合計 6 つのステップがあります。
1. D4 に基づいて収集された GPT-4 によって生成された患者のポートレートを使用して、患者エージェントのバッチを初期化します。うつ病性障害の診断結果は、患者相談の過程で患者エージェントに提供されることはありません。 2. 患者エージェントと精神科医エージェントがうつ病の相談や雑談を行います。
3. 2 番目のステップでは、インストラクター プラグインは会話の進行に従って患者が述べた症状を追跡し、次のステップの会話の提案を精神科医エージェントに提供します。
4. 相談ダイアログが終了すると、インストラクター プラグインは、精神科医エージェントによる患者の最終診断と、D4 に保存されている実際の医師の診断を比較します。 5. 指導者プラグインは、診断結果の比較に基づいて精神科医エージェントに提供した指導を要約し、精神科医エージェントに提供します。
6. 相談プロセスが完了すると、精神科医は次の患者エージェントに電話して診断を実行し、プロセスを繰り返します。

会話や診断を処理するための記憶をより適切に検索するために、研究者らは、会話履歴、電子医療記録、要約スキルという 3 層のエージェント メモリ アーキテクチャを構築しました。で:
* 診断履歴は、現在の会話の履歴記録です。
* 電子医療記録 (Electronic Medical Record) は、各患者の診察後に精神科医エージェントによって要約された会話の要約であり、患者の主訴、症状、その他のイベント情報が含まれます。
※診断スキルとは、指導者プラグインによって要約され、精神科医エージェントのメモリに保存される指導意見であり、その後の対話プロセスの最適化や診断精度の向上に役立ちます。

実験結果: うつ病と自殺傾向の診断の精度が向上する
AMC の有効性を評価するために、研究者らは D4 テスト セットで 2 セットの実験を実施しました。
一つは、D4 のオリジナル対話を精神科医エージェントと患者エージェントの診断用対話対話として使用し、モデルの診断能力をテストする方法です。 2つ目は、精神科医エージェントと患者エージェントの対話を通じて診断を行い、エージェントのロールプレイング能力と診断能力を総合的に検討することです。
研究者らは、うつ病性障害と自殺傾向の診断精度を別々に計算した(カテゴリーはなし、軽度、中等度、重度)。階層構造のあるメモリとメモリのない AMC システムを比較すると、テスト セット上のモデルの全体的なパフォーマンスが向上していることが結果からわかります。階層型メモリアーキテクチャを活用したAMCの有効性を、簡易診断でも対話+診断でもある程度改善できることを検証します。

3層メモリ構造の有効性をさらに検証するために、研究者らは、モデルの精度を安定的に向上させることができる電子カルテや要約スキルのメモリを追加しながらアブレーション実験を実施し、3層メモリ構造の有効性を証明した。

講師プラグインの効果を検証するために、研究者らはプラグインアブレーション実験も実施した。実験によれば、インストラクター プラグインは AMC システムのアーキテクチャにも一定の改善効果をもたらします。

音の謎を探る
近年、AIは呼吸器疾患や消化器疾患の音声ベースの検出など、さまざまな病気の診断と治療において強力な能力を実証しています。精神疾患の診断と治療の進歩は、質の高い関連データが不足しているために遅れています。その理由は、精神疾患を患う患者のほとんどが未だに偏見を持っており、関連する診断や治療の記録には患者のプライバシーが含まれるため、AI モデルのトレーニング用の大規模なデータセットを形成することが難しいためです。
Wu Mengyue の研究グループの主な研究方向は、計算論的精神医学と音声理解における病理学的音声研究です。上記の研究で使用された D4 データ セットは、臨床基準を満たし、彼女のチームによって構築された世界初のオープンソースのうつ病相談対話データ セットであり、関連研究の強固な基盤を提供します。
Wu Mengyue 教師も豊富な個人的経験を持ち、心理音響研究の背景があり、AI とメンタルヘルス研究を組み合わせることに熱心であることは言及する価値があります。 HyperAI Super Neural はかつて教師の Wu Mengyue に綿密なインタビューを実施しました。クリックするとレポート全文が表示されます: 上海交通大学のウー・メンユエ氏: 言語知能テクノロジーを使用して、精神疾患の最初の診断と治療の指示を処方します。
この研究論文の筆頭著者は、上海交通大学電子情報電気工学部コンピュータサイエンス学科の Lan Kunyao 博士です。彼は上海交通大学を情報セキュリティの学士号を取得して卒業し、主な研究の方向性は精神疾患の診断と治療のための対話システムであり、2023 年の数理医学技術および応用イノベーション コンテストで 2 位を受賞しました。第13回全国大学生情報セキュリティコンクール。

彼の研究グループが所属する上海交通大学X-LANCE研究室の正式名称は、上海交通大学クロスメディア言語知能研究室です。2012 年に設立され、以前は知的音声研究所 (SpeechLab) として知られていましたが、長年の開発を経て、視聴覚言語情報処理の中核研究分野をカバーする「クロスモーダル言語知能研究所」になりました。

現在、クロスメディア言語インテリジェンス研究室の教育チームには教授 1 名、准教授 4 名、科学研究助手 1 名がおり、ACM クラス、AI クラス、IEEE クラスを含む 20 名以上の博士課程の学生と 30 名以上の修士課程の学生がいます。 、電子工学のクラスには、CS およびその他の専攻、エコール デ インヂュニア、JI を専攻する学部生が 30 人以上います。
この研究室は、国家重点研究開発プログラムや中国優秀青少年科学基金自然科学財団など、多くの国家および企業のプロジェクトから支援を受けています。当研究室はSpichi Technology Co., Ltd.との緊密な協力関係にあり、「上海交通大学Spichiインテリジェント・ヒューマン・コンピュータ・インタラクション共同研究室」を設立しました。この研究所は、数百もの H800、A800、A10 およびその他の GPU カードの豊富なデータ リソースと豊富なコンピューティング リソースを活用することができ、産業レベルの大規模なデータ分析と研究を実行できる世界でも数少ない人工知能研究所の 1 つです。
心理学の背景があり、メンタルヘルスのコンピューティングに興味のある学生は、研究に参加することを歓迎します~
研究室ホームページ: