우울증 초기검진에 도움을 주세요! Shanghai Jiao Tong University 팀은 에이전트 심리 클리닉을 구축했으며 첫 번째 논문에서는 기술적 하이라이트를 공유하기 위해 온라인 데모를 발표했습니다.

"그녀를 때리고, 목을 조르고 구석으로 밀어붙이기도 여러 번 했어요. 그럴 때마다 후회했어요. 왜 때렸을까요? 왜 제 자신을 다스리지 못했을까요? 제가 나쁜 놈인가요, 미친 놈인가요, 아니면 용서받을 수 없는 놈인가요? 하지만 정말 어떻게 해야 할지 모르겠어요."18세의 하오란은 CCTV 카메라를 마주보며 이렇게 말했다.
올해 8월, CCTV 뉴스 '상대성' 기자 좡성춘은 청소년 우울증의 실태를 심층적으로 조사했습니다. 하오란은 카메라 앞에 서서 자신의 이야기를 들려줄 의향이 있는 소수의 십대 우울증 환자 중 한 명이었습니다.
요즘은 우울증이 점점 더 젊어지고 있습니다. "중국 청소년 발전 보고서"에 따르면, 17세 미만의 어린이와 청소년 약 3,000만 명이 다양한 정서 장애와 행동 문제를 겪고 있습니다. 청소년은 격동의 시기이며 심리적으로 상대적으로 취약합니다. 문제가 파악되지 않고 적절한 시기에 개입하지 않으면, 결국 정신 질환으로 발전하게 됩니다. 그러나 현재 정신건강 의료자원은 현저히 부족하며, 대부분의 자원은 도시와 대규모 의료기관에 집중되어 있습니다. 이러한 불균형적인 분포로 인해 많은 우울증 환자가 적절한 시기에 의료 지원을 받는 데 어려움을 겪습니다.
이에 대해 상하이 교통대학교 X-LANCE 연구실의 우멍웨이 교수 팀은 텍사스 대학교 알링턴 캠퍼스(UTA), 천교 뇌과학 연구소(TCCI), ThetaAI와 협력했습니다.우울증의 예비 진단을 위해 자동화된 대형 모델 대화 에이전트 시뮬레이션 시스템인 에이전트 정신 클리닉(AMC)이 구축되었습니다.
HyperAI는 4번째 Meet AI4S 라이브 방송에서 이 연구 논문의 첫 번째 저자인 상하이 교통대학교 크로스미디어 언어 지능 연구실의 란 쿤야오 박사를 초대했습니다.그는 "빅모델 에이전트 기반 정신건강 진단 및 상담 플랫폼"이라는 주제로 플랫폼의 사용 단계, 기술적 주요 내용, 향후 계획을 자세히 소개했습니다.
롤플레잉을 기반으로 한 에이전트 심리학 클리닉 시뮬레이션 상담에 참여하세요.
과거에는 학교에 등록하거나 직장에 들어갈 때 정신 건강 검사를 받는 등 추가적인 의료 자원이 필요한지 확인하기 위해 자가 평가 양식(PHQ9, HAM-D 등)을 자주 사용했습니다. 무작위로 양식이 작성되는 것을 방지하기 위해 자체 평가 양식의 많은 질문이 일관성을 유지하고자 반복적으로 묻습니다. 이로 인해 여러 가지 문제가 발생합니다. 작업량은 두 배로 늘어나고 사용자는 지루함을 느끼게 됩니다.

이제 인간-컴퓨터 상호작용의 도움으로, 즉 대화 로봇과 채팅하여 상담 과정을 시뮬레이션할 수 있습니다.의사와 환자 간의 소통이 더욱 흥미로워졌고, 대규모 언어 모델이 개발되면서 대화 경험도 꾸준히 개선되고 있습니다.

우멍웨이 교수팀이 제안한 지능형 심리 클리닉(AMC)은 우울증의 예비 진단에 활용될 수 있다. 주된 형태는 연극 공연을 시뮬레이션하고 롤플레잉과 유사한 작업을 수행하는 것입니다. 이 과정에서 사용자는 가상 배우 NPC와 소통하여 협의 과정을 진행할 수 있습니다. 구체적으로,연구자들은 주로 환자 에이전트, 정신과 의사 에이전트, 강사 에이전트의 세 가지 "역할"을 설정했습니다.

사용자는 세 가지 역할 중 하나를 선택하여 경험할 수 있습니다.
이 세 가지 에이전트에 대한 자세한 정보는 다음과 같습니다.
* 환자 대리인은 감정적으로 혼란스러워합니다.질병이 있는지 확인하고 추가 치료가 필요한지 판단하기 위해 의사를 만나야 합니다. 연구자들은 다양한 사용자 프로필을 제공하여 서로 다른 문제에 직면할 수 있고 연령대도 다를 수 있는 여러 환자를 시뮬레이션할 수 있도록 했습니다.

구체적으로 연구자들은 D라는 기술을 사용했습니다.4 데이터 세트,즉, 성별, 직업, 주요 요구 사항, 연령 등의 정보를 담은 잠재적 환자의 사진을 소셜 미디어나 공개 플랫폼을 통해 모집했습니다. 이러한 초상화는 환자를 시뮬레이션하는 데 사용되기 전에 엄격한 검토와 검증을 거쳤습니다. 가상 환자와 가상 의사를 모집하고 훈련하며, 양측이 가상 상담 대화를 진행합니다. 전문 심리학자들은 이러한 대화의 질을 평가하여 실제 의사-환자 의사소통 시나리오와 일치하는지 확인합니다. 그렇다면 전문 의사는 환자의 우울증과 자해 경향을 더욱 자세히 판단하게 될 것입니다. 이러한 진단은 장벽 없음, 경미함, 중등도, 심각함의 네 가지 범주로 나뉩니다.
*디4 임상 기준을 충족하는 세계 최초의 오픈 소스 우울증 상담 대화 데이터 세트입니다.
데이터 세트 주소:https://x-lance.github.io/D4/

연구진은 환자 에이전트를 초기화할 때, 환자 에이전트에게 상기 의료 인터뷰 결과를 제공하지만, 우울증 경향과 자해 경향의 구체적인 수치는 환자 에이전트에게 알려주지 않아 데이터 유출을 방지합니다. 또한, 환자 대리인의 증상은 일반적으로 식단, 수면, 기분, 관심사, 신체 상태 등으로 나타나지만, 이러한 정보만으로는 환자를 완전히 설명하기에 충분하지 않습니다. 그들은 또한 삶, 직장, 공부에서 압박을 받습니다. 이런 요인들은 구체적인 증상보다는 대화에 반영되는 경우가 많습니다.
이를 위해 연구진은 GPT-4를 사용하여 대화 내용을 분석하고 해당 사건과 관련된 기억 조각을 찾아내고, 이러한 기억을 환자 에이전트의 기억 모듈에 통합하기로 했습니다. 통합된 기억에는 배우자의 배신, 직장과 학업에서의 좌절 등에 대한 정보가 포함됩니다.
* 정신과 의사 대리인의 설정은 상담 경험이 없는 신규 의사의 설정입니다.목표는 의사가 환자와 소통하는 데 있어 상당한 진전을 이룰 수 있는지 테스트하는 것입니다.
의사 측에서 대리인은 초기 단계에서는 실질적인 경험을 많이 얻지 못하지만, 연구자는 의사의 대리인의 초기 기억의 일부로 단일 에피소드 우울증과 재발 우울증에 대한 텍스트 설명과 같은 기본적인 전문 정보를 제공합니다. 환자와의 상호작용 횟수가 증가함에 따라 의사 대리인의 기술과 경험은 계속해서 축적되어 상담 수준이 향상될 것입니다.
* 강사 에이전트의 주요 목적은 의사와 환자 간의 대화 흐름을 제어하는 것입니다.끝없이 이어지는 대화는 피하세요. 앞으로 부모와 자녀, 부부가 함께 상담하는 등 가족상담 시나리오로 확장된다면 여러 상담원 간의 상호작용으로 갈등이 발생할 수 있는데, 이때 지도 상담원이 대화 과정을 조정하는 데 도움을 줄 수 있습니다.
협의 과정에서의사가 질문하고 환자가 대답하고, 강사는 환자의 대답을 추적하고 질병 증상을 기록합니다. 강사는 환자의 증상을 ICD-11, DSM-5 등의 표준 검사 결과와 비교한 후, 아직 해결되지 않은 문제가 무엇인지 지적하고 의사에게 다음에 물어봐야 할 질문에 대한 지침을 제공합니다. 의사는 이러한 지시를 바탕으로 환자에게 새로운 질문을 던지며 내부적인 순환을 형성합니다. 각 상담이 끝날 때마다 의사는 환자의 우울증과 자해 경향을 평가합니다.

강사는 이러한 평가 결과를 수신하여 D와 비교합니다.4 해당 데이터는 데이터 세트에 저장된 실제 의사의 진단 결과와 비교됩니다. 강사는 대화 내역과 진단 결과의 차이점을 바탕으로 진찰 중 의사의 언어 표현, 질문 방법, 진단 정확도 등을 평가합니다. 마지막으로, 강사는 반영된 기억을 의사의 진단 기술에 저장하여 의사 대리인이 상담 과정에서 더 많은 경험을 얻고 성장할 수 있도록 돕습니다.
대화와 진단을 처리하기 위한 적응 기억을 더 잘 인출하기 위해 연구자들은 대화 내역, 전자 의료 기록, 요약 기술이라는 혁신적인 3중 기억 구조와 기억 인출 모듈을 제안했다는 점도 언급할 가치가 있습니다.
플랫폼은 지속적으로 최적화되고 있으며 미래는 밝습니다.
롤플레잉 과정에서 연구진은 여러 가지 문제에 직면했으며, 앞으로 이를 최적화할 예정입니다.
첫째, 환각의 문제가 있습니다.즉, 이 모델은 사실과 일치하지 않는 대화 응답을 생성할 것입니다. 이는 모든 대형 모델에서 공통적으로 나타나는 문제입니다. 예를 들어, 환자가 지난달에 자해에 대한 생각을 했지만 실행에 옮기지 않았더라도 모델은 환자가 매달 자해 행동을 한다고 잘못 응답할 수 있습니다. 이런 거짓 긍정 현상은 긴 대화에서 더 두드러진다. 환각 현상을 다루기 위해, 유사한 문제에 직면했을 때 연구자들은 사용자 초상화의 몇 가지 주요 증상을 신호로 삼아 모델을 더욱 촉진했지만, 이러한 접근 방식은 환각 현상을 일시적으로 완화할 수 있을 뿐이며, 앞으로 더 많은 노력이 필요합니다.
또 다른 문제는 언어 스타일입니다.환자는 처음 의사를 방문했을 때 자신의 상태를 설명하기 위해 기술 용어를 사용하지 않는 경우가 많지만, 모델은 첫 번째 진찰 시 환자의 성과와 일치하지 않는 "신경 운동 지연"과 같은 기술 용어를 사용하는 경향이 있습니다.

연구자들은 또한 이 모델이 반복적으로 질문을 던지는 경향이 있다는 것을 관찰했습니다.예를 들어, 과거의 역사적 대화의 영향을 받아 모델의 시작과 마무리 발언은 비교적 고정되어 있으며, 질문을 던지는 방식도 비교적 일관적입니다. 하지만 실제 대화에서는 이런 요소들이 바뀔 수 있으며, 반응도 다양합니다. 대화가 지루하지 않도록 적절한 위안을 어떻게 제공할 것인가 하는 것도 앞으로 고민해야 할 문제입니다.
위 콘텐츠를 최적화하는 데 있어 가장 큰 문제는 일관되지 않은 평가 기준과 전문적인 시나리오 데이터 세트의 부족입니다.작년 5월, 우멍웨이 교수팀의 천시위안 박사는 대규모 언어 모델을 기반으로 의사와 환자 간의 대화를 시뮬레이션했습니다. 연구 결과에 따르면 대형 모델은 인간의 용어와 확실한 차이가 있는 것으로 나타났습니다. 프롬프트를 수정하고 모델에서 구어체 표현을 사용하도록 하면 이 증상을 부분적으로 완화할 수 있습니다.

평가 기준의 불일치 문제에 대해 사람들은 일반적으로 "양질의 대화"에 대한 일반적인 인식을 가지고 있지만, "중간"과 "양질" 대화에 대한 평가 기준에는 상당한 차이가 있습니다. 이는 개인의 평가에 따른 주관적 오류로 인해 발생할 수 있으므로, 대규모 인체 실험이 필요합니다. 또한 많은 연구에서는 GPT-4와 같은 고품질 모델을 사용하여 다른 모델을 평가합니다. 그러나 대규모 모델은 해석 가능성이 상대적으로 약한 블랙박스와 같으며, 인간 평가자의 질과 수도 제한적입니다. 따라서 아직까지 대규모 자동화된 평가 표준이 부족한 실정이다.
또한, 다양한 애플리케이션 시나리오에 필요한 데이터 세트는 다릅니다. 특히 전문적인 시나리오에서는 사용 가능한 샘플 크기가 작은 경우가 많아 테스트의 신뢰도에 영향을 미칠 수 있으며, 대규모 모델의 학습도 제한될 수 있습니다. 이와 관련하여 란 쿤야오는 미래의 해결책은 심리적 인지 모델 개념을 롤플레잉 실습에 도입하는 것이라고 믿습니다. 다양한 시나리오에 적응할 수 있는 보다 일반적인 인지 모델을 구축하고 이 모델에 기존 네트워크 리소스를 효과적으로 매핑할 수 있다면 후속 교육 및 테스트 세트를 얻기가 더 쉬워질 것이며, 이는 탐색할 가치가 있는 방향입니다.
"저는 이러한 확률적 모델이 결국 완전하고 독립적인 성격적 사고를 형성할 수 있는지에 대해 항상 더 탐구하고 싶었고, 대규모 언어 모델에 내재된 성격적 특성을 평가하는 보다 안정적인 방법을 찾고 싶었습니다."란 쿤야오는 이러한 모델이 대량의 사용자 코퍼스와 사용자 데이터를 학습했기 때문에 이론적으로는 성격 특성을 나타낼 수 있어야 한다고 말했습니다. 이를 바탕으로 논의해야 할 것은 모델이 이러한 성격 특성을 가지고 있는지 평가하는 방법과 이러한 성격 특성이 질문에 대한 답변, 인지 과정, 사용자 요구 사항(예: 심리적 편안함)에 대한 응답 성능에 어떤 영향을 미치는지입니다. "모델의 성격 특성이나 성격 모듈을 찾아 구별할 수 있다면, 다양한 시나리오와 요구 사항에 맞게 모델을 조정하고 다양한 작업을 수행할 수 있습니다. 이는 즉각적인 조정에만 의존하는 것보다 더 효과적입니다."
기술로 세상을 바꾸다
학부 과정에서 이미지 처리를 전공했고, 대학원 과정에서는 자연어 처리에 점차 관심을 갖게 되었습니다. 당시 제 연구 방향은 스마트 교육이었고, 그 과정에서 학생들의 개인 맞춤형 학습 요구와 관련된 주제를 접하게 되었습니다. 이후 학생들을 위한 학습 도우미를 디자인할 때,저는 학생들에게 학업적 도움뿐만 아니라 심리적 지원도 필요하다는 것을 깨달았습니다.그래서 박사과정을 밟는 동안 저는 우멍웨이 교수님의 팀에 합류하여 심리학 분야에서 더 심도 있는 탐구를 하고 싶었습니다. 란쿤야오 박사는 대규모 에이전트 심리 클리닉을 만드는 원래 의도에 대해 이야기하면서 이렇게 말했습니다.
우멍웨이 교수는 심리학과 컴퓨터 과학 분야에서 학제적 배경을 갖춘 보기 드문 전문가입니다. 그녀는 AI를 활용한 정신 질환 진단 및 치료를 촉진하는 과정에서 환자의 실제적 요구에 정확하게 대처하고 연구 전략을 유연하게 조정할 수 있습니다.
그녀가 일하고 있는 상하이 교통대학교 크로스미디어 언어 지능 연구실(X-LANCE)은 현재 "크로스 모달 언어 지능 연구실"로 발전하여 시청각 언어 정보 처리의 핵심 연구 영역을 포괄하고 재료 화학 분야도 포함하고 있습니다. 이 팀은 세상을 바꿀 수 있는 최고 수준의 기술 연구를 수행하는 데 전념하고 있습니다. 연구실의 학문적 신조는 다음과 같습니다. 기술로 세상을 바꾸려면 먼저 뛰어난 엔지니어가 되어야 하고, 뛰어난 엔지니어는 과학자가 되어야 합니다.
연구실 홈페이지:https://x-lance.sjtu.edu.cn

본 연구실은 국가중점연구개발계획, 중국자연과학기금의 우수젊은과학자지원금 등 많은 국가 및 기업 프로젝트로부터 지원을 받았습니다. 또한 AIS 테크놀로지 주식회사와 긴밀히 협력하여 "상하이 교통대학 AIS 지능형 인간-컴퓨터 상호작용 공동 실험실"을 설립했습니다. 여기에는 수백 개의 H800, A800 및 A10 GPU 카드를 포함하여 풍부한 데이터 리소스와 대규모 컴퓨팅 리소스가 있습니다. 이곳은 산업 수준의 대규모 데이터 분석과 연구를 수행할 수 있는 세계에서 몇 안 되는 인공지능 연구소 중 하나입니다.