에이전트 심리 클리닉이 온라인에서 오픈했습니다! 상하이 교통대학교 연구팀은 1.3K건의 우울증 상담 대화를 기반으로 우울증을 진단할 수 있는 대규모 모델 대화 에이전트를 구축했습니다.

정신 건강 문제는 오늘날 사회가 직면한 가장 큰 과제 중 하나입니다. WHO의 세계 정신 건강 보고서에 따르면, 약 2억 4,600만 명이 우울증 장애를 앓고 있으며, 10만 명당 평균 3,153건의 우울증 사례가 발생합니다. 가장 흔한 정신질환 중 하나라고 할 수 있다.
그러나 오늘날 정신 건강을 위한 의료 자원은 여전히 부족하며, 특히 저소득 및 중소득 국가에서는 더욱 그렇습니다. 또한 모든 국가 및 지역에서전문적인 정신건강 의료자원은 주로 도시와 대규모 기관에 집중되어 있어 병원 자원 배분의 불균형이 발생합니다.이로 인해 우울증과 같은 정신 질환을 앓고 있는 환자가 적절한 의료 지원을 적시에 받는 것이 어렵습니다.
의료 자원을 보다 효율적으로 분배하고 자원 제약으로 인한 딜레마를 완화하기 위해서는 효율적이고 정확한 자동 우울증 진단 방법이 중요하고 필수적입니다. 다양한 자동 진단 방법 중에서 대화형 에이전트는 비용 효율성, 시간 절약, 사용자 익명성 유지 등의 이유로 매우 효과적인 것으로 간주됩니다. 진단 대화가 진행됨에 따라 다음 사항이 주목할 만합니다.상담원의 대화 전략은 환자의 정신 상태와 의사-환자 관계의 진행 상황에 따라 바뀌어야 합니다.이는 의심할 여지 없이 대화 에이전트의 구성에 심각한 문제를 제기합니다.
위의 문제에 대한 대응으로,상하이 교통대학 X-LANCE 연구실의 우멍웨이 교수 팀은 텍사스 대학교 알링턴 캠퍼스(UTA), 천교 뇌과학 연구소(TCCI), ThetaAI와 협력하여 자동화된 대형 모델 대화 에이전트 시뮬레이션 시스템인 Agent Mental Clinic(AMC)을 구축했습니다.우울증의 초기 진단에 사용됩니다. 이 시스템은 정신과 의사와 잠재적 우울증 환자를 동시에 시뮬레이션할 수 있으며, 우울증 상담 대화를 시뮬레이션할 수 있습니다. 또한, AMC는 대화 과정을 최적화하고 정신과 의사를 지도하기 위해 정신과 의사에게 다음 대화 라운드에 대한 지침을 제공하는 강사 역할도 설계했습니다. 시스템의 모든 역할은 실제 사람이 수행할 수도 있고 대규모 모델을 통해 구현할 수도 있습니다.
진단 환경의 요구에 더 잘 적응하기 위해 AMC는 널리 사용되는 대형 모델 에이전트 구축 아이디어를 활용하고, 3중 메모리 저장 구조와 새로운 메모리 검색 메커니즘을 제안하여 더욱 효율적이고 정확한 우울증 상담 및 초기 선별 검사를 실현합니다. 이 대화 시스템은 잠재적인 우울증을 앓고 있는 환자를 사전 선별하는 데 사용될 수 있을 뿐만 아니라, 연수 중인 정신과 의사나 학생을 교육하여 인턴십을 위해 공식적으로 학과에 들어가기 전에 몇 가지 지침과 도움을 제공하는 데에도 사용될 수 있습니다. 전문 정신과 의사가 수행할 수 있는 강사 역할은 대규모 모델을 기반으로 하는 정신과 의사 에이전트에 대한 실행 가능한 최적화 아이디어를 제공합니다.
"우울증 진단 대화 시뮬레이션: 3차 기억력을 갖춘 자기 개선 정신과 의사"라는 제목의 관련 연구가 사전 인쇄본으로 출판되었습니다.
연구 하이라이트:
* 환자 상담원과 정신과 의사 상담원 간의 진단 대화를 시뮬레이션하는 새로운 유형의 대화 상담원 시뮬레이션 시스템이 구축되어, 수련 정신과 의사의 교육과 잠재적 우울증 환자의 사전 선별을 위한 효과적인 새로운 방법을 제공합니다.
* 진단 단계에서 에이전트의 요약 능력을 강화하기 위한 혁신적인 3중 메모리 구조와 메모리 검색 모듈을 제안하여, 향후 우울증 진단 및 대화 시뮬레이션 최적화를 위한 새로운 방향을 제시합니다.
* AMC 시스템은 우울증 진단과 자살 예측을 모두 개선했으며, 이 프레임워크는 다른 특정 도메인에도 적용할 수 있으며 제한된 레이블이 지정된 사례에 대한 훈련에 적합합니다.

서류 주소:
https://arxiv.org/abs/2409.15084
오픈소스 프로젝트인 "awesome-ai4s"는 100개가 넘는 AI4S 논문 해석을 모아 방대한 데이터 세트와 도구를 제공합니다.
https://github.com/hyperai/awesome-ai4s
디4 전문 의사들이 검증한 데이터 세트
디4 이 데이터 세트는 우멍규 교수 팀에서 수집하였고 전문 의사들이 품질을 검증했습니다.대화 데이터 세트는 세 단계로 구성됩니다.
* 소셜 미디어와 기타 플랫폼에서 설문지를 배포하여 실제 우울증 환자의 개인적 모습을 수집하고 구성합니다.
* 모의 환자와 모의 의사를 모집하고 훈련하고, 수집된 우울증 환자의 초상화를 모의 환자에게 제공한 후, 모의 의사와 모의 환자가 우울증 상담 대화를 진행하게 합니다.
* 수집된 모의대화 내용은 전문 정신과 전문의에게 전달되어 상담대화의 질을 검증하게 되며, 질적 기준을 충족하는 대화에 대해서는 우울증의 심각도 평가 및 증상 요약을 실시합니다.

수집 및 검증 후, 우멍웨이 교수의 팀은 우울증 상담 데이터 세트 D4를 구축하기 위해 만족스러운 품질의 대화 총 1,339개를 수집했습니다. 우울증의 정도는 크게 없음(대화 430건), 경미함(대화 342건), 보통(대화 368건), 심각함(대화 199건)의 4가지 범주로 구분하였으며, 평균 대화 횟수는 21.6회였다. 이후, 우멍웨이 교수 팀은 D4 데이터세트에 주석을 달기 위해 SEO 우울증 증상 진단 주석 프레임워크를 제안했습니다.

혁신적인 3층 메모리 구조 및 메모리 검색 모듈
연구진은 3개 계층 메모리 저장 구조와 새로운 메모리 검색 메커니즘을 갖춘 자동화된 대형 모델 대화 에이전트 시뮬레이션 시스템을 제안했습니다. 여기에는 다음 3개 모듈이 포함됩니다.
* 환자 대리인:환자 에이전트는 D4 사용자 프로필과 우울증 상담 대화에서 추출한 사용자 정보를 사용하여 초기화됩니다. AMC는 D4에서 100개의 고전적 사례를 훈련 세트로 선택하고, GPT-4를 사용하여 환자의 초기 메모리 노드로 의료 상담 대화에서 이벤트 정보를 추출했습니다.
* 정신과 의사 대리인:ICD-11에 있는 우울증 장애에 대한 설명과 진단 기준을 초기화에 활용하였고, 진단이 진행됨에 따라 환자의 전자 의무 기록과 요약된 진단 기술을 축적하였다.
* 감독자 플러그인:정신과 의사 대리인과 환자 대리인의 진단 결과를 비교하고, 경험을 요약하여 정신과 의사 대리인에게 전달하여 보관하는 데 사용됩니다.

전체 AMC 시스템의 동작 과정은 총 6단계로 구성되어 있으며, 그림과 같다.
1. D4에서 수집한 데이터를 기반으로 GPT-4가 생성한 환자 초상화를 사용하여 환자 에이전트 배치를 초기화합니다. 우울증 장애의 진단 결과는 환자의 상담 과정에서 환자 대리인에게 제공되지 않습니다. 2. 환자 상담원과 정신과 상담원이 우울증 상담에 관해 대화를 나누고 있습니다.
3. 두 번째 단계에서는 강사 플러그인이 환자가 언급한 증상을 추적하고 대화 진행 상황에 따라 정신과 의사 상담원에게 대화의 다음 단계에 대한 제안을 제공합니다.
4. 상담 대화가 끝나면 강사 플러그인은 정신과 의사 에이전트의 환자에 대한 최종 진단을 D4에 저장된 실제 의사의 진단과 비교합니다. 5. 강사 플러그인은 진단 결과의 비교를 바탕으로 정신과 상담사에게 제공된 지침을 요약하여 정신과 상담사에게 제공합니다.
6. 정신과 의사는 상담 과정을 마친 후 다음 환자 대리인에게 전화하여 진단을 내리고 과정을 반복합니다.

대화와 진단을 처리하기 위해 적응된 메모리를 더 잘 검색하려면연구자들은 대화 내역, 전자 의료 기록, 요약 기술이라는 3중 계층의 에이전트 메모리 아키텍처를 구축했습니다.안에:
* 진단 내역은 현재 대화의 내역 기록입니다.
* 전자 의료 기록(EMR)은 정신과 의사가 환자와의 상담 후 작성한 대화 요약으로, 환자의 불만, 증상 및 기타 이벤트 정보가 포함됩니다.
* 진단 기술은 강사 플러그인에 의해 요약되고 정신과 상담원의 메모리에 저장되는 지침 의견으로, 대화 과정과 진단 정확도를 최적화하는 데 도움이 됩니다.

실험적 결론: 우울증 및 자살경향 진단 정확도 향상
연구자들은 AMC의 효과를 평가하기 위해 D4 테스트 세트에서 두 세트의 실험을 수행했습니다.
하나는 D4의 원래 대화를 정신과 의사 에이전트와 환자 에이전트 간의 상담 대화로 사용하여 진단을 실시하고, 이를 통해 모델의 진단 능력을 테스트하는 것입니다. 두 번째는 정신과 의사 대리인과 환자 대리인 간의 대화를 통해 진단을 내리는 것으로, 대리인의 롤플레잉 능력과 진단 능력을 종합적으로 검토합니다.
연구진은 우울증 장애와 자살성향에 대한 진단 정확도를 각각 없음, 경미함, 중등도, 심각도로 분류하여 계산했습니다. 메모리가 있는 AMC 시스템과 메모리가 없는 AMC 시스템을 비교한 결과, 테스트 세트에서 모델의 전반적인 성능이 향상되었음을 알 수 있습니다.AMC가 계층적 메모리 구조를 활용하는 데 있어서 효과성이 검증되었으며, 단순 진단과 대화+진단 모두 일정 정도 향상될 수 있습니다.

3층 메모리 구조의 효과를 더욱 검증하기 위해,연구진은 절제 실험을 수행하여 전자 의무 기록 메모리와 요약 기술을 동시에 추가하면 모델의 정확도가 안정적으로 향상됨을 확인했으며, 3층 메모리 구조의 효과성을 입증했습니다.

강사 플러그인의 효과를 확인하려면,연구자들은 또한 플러그인에 대한 절제 실험을 수행했습니다. 실험 결과, 강사 플러그인은 AMC 시스템 아키텍처에도 어느 정도 개선 효과가 있는 것으로 나타났습니다.

소리의 비밀을 발견하세요
최근 몇 년 동안 AI는 다양한 질병의 진단과 치료에 강력한 역량을 보여주었습니다. 예를 들어, 음성을 기반으로 호흡기 및 위장관 질환을 감지하는 것이 그 예입니다. 그러나 정신 질환의 진단 및 치료는 관련 데이터의 질이 낮아서 진전이 느렸습니다. 그 이유는 정신 질환을 앓고 있는 대부분의 환자들이 여전히 자신의 질병에 대해 수치심을 느끼고 있으며, 관련 의료 기록은 환자의 개인정보와 관련되어 있어 AI 모델 학습을 위한 대규모 데이터 세트를 형성하기 어렵기 때문입니다.
우멍웨 연구 그룹의 주요 연구 방향은 청각 이해에 있어서 계산 정신의학과 병리학적 언어 연구입니다.위에 언급된 연구에 사용된 D4 데이터 세트는 그녀의 팀이 구축한 임상 기준을 충족하는 세계 최초의 오픈 소스 우울증 상담 대화 데이터 세트로, 관련 연구를 위한 견고한 기반을 제공합니다.
우멍웨 선생님은 풍부한 개인적 경험을 가지고 있고, 심리음향 연구 분야에서 경력을 쌓았으며, AI와 정신 건강 연구를 결합하는 데 전념하고 있다는 점도 언급할 가치가 있습니다. HyperAI는 우멍규 교수와 심층 인터뷰를 진행했습니다.전체 보고서를 보려면 클릭하세요: 상하이 교통대학교의 우멍웨: 음성 지능 기술을 사용하여 정신 질환에 대한 최초의 진단 및 치료 명령을 내렸습니다.
이 연구 논문의 첫 번째 저자는 박사 학위를 소지한 Lan Kunyao입니다. 상하이 교통대학교 전자정보 및 전기공학부 컴퓨터 과학과 학생입니다.그는 상하이 교통대학교에서 정보 보안학 학사 학위를 취득했습니다. 그의 주요 연구 방향은 정신 질환의 진단과 치료를 위한 대화 시스템입니다. 그는 2023년 수리의학기술 및 응용혁신 경진대회에서 2등상을 수상하였고, 제13회 전국대학생 정보보안 경진대회에서 1등을 수상하였습니다.

그의 연구 그룹이 속한 상하이 교통대학교 X-LANCE 연구실은 상하이 교통대학교 크로스미디어 언어 지능 연구실이라고 합니다.2012년에 설립되었으며, 이전에는 Intelligent Speech Laboratory(SpeechLab)였습니다. 수년간의 개발을 거쳐, 시청각 언어 정보 처리의 모든 핵심 연구 분야를 포괄하는 "크로스 모달 언어 지능 연구소"가 되었습니다.

현재 크로스미디어 언어 지능 연구실 교수진은 교수 1명, 준교수 4명, 연구 조교 1명으로 구성되어 있으며, 박사과정 학생 20명 이상, 석사과정 학생 30명 이상, ACM 수업, AI 수업, IEEE 수업, 전기공학부 CS 전공생, 파리 우수 연구소, 미시간 연구소 출신 학부생 30명 이상으로 구성되어 있습니다.
본 연구실은 국가중점연구개발계획, 중국자연과학기금의 우수젊은과학자지원금 등 많은 국가 및 기업 프로젝트로부터 지원을 받았습니다. 본 연구실은 AISpeech Technology Co., Ltd.와 긴밀히 협력하여 "상하이 교통대학 AISpeech 지능형 인간-컴퓨터 상호작용 공동 연구실"을 설립했습니다. 연구실은 최대 수백 개의 H800, A800, A10 및 기타 GPU 카드의 풍부한 데이터 리소스와 풍부한 컴퓨팅 리소스를 동원할 수 있습니다. 이곳은 산업 수준의 대규모 데이터 분석과 연구를 수행할 수 있는 세계에서 몇 안 되는 인공지능 연구소 중 하나입니다.
심리학 전공이고 계산적 정신 건강에 관심이 있는 학생들은 연구에 참여할 수 있습니다.
연구실 홈페이지: