HyperAI초신경

인간은 기쁨과 슬픔이라는 동일한 감정을 공유하지 않지만, 감정 분석 모델을 사용하면 그 감정을 이해할 수 있습니다.

4년 전
대형 공장 뉴스
神经小兮
特色图像

소셜 미디어는 오늘날 사람들의 삶에 점차 자리 잡았으며, 심리학자들이 연구를 수행하는 데 중요한 데이터 원천이 되기도 했습니다. 동시에 연구자들은 자연어 처리와 머신 러닝 기술을 사용하여 소셜 미디어 사용자의 감정 변화를 예측하려고 노력하고 있습니다.

작년에 갑자기 발생한 신종 코로나바이러스는 사람들의 삶에 큰 영향을 미쳤습니다. 이 특별한 역사적 시기에 일반 대중의 심리는 민감하고 연약해졌습니다.

전염병 기간 동안 사람들은 외출과 접촉이 줄어들어 소셜 네트워크에 더 많은 시간을 보냈습니다. 어떤 사람들은 불가피하게 인터넷을 통해 자신의 직장과 삶에 대한 불만을 다른 사람들에게 표출합니다. 공황, 불안, 슬픔, 무력감 등 부정적인 감정도 증가했습니다.

공공 비상사태에 직면하여 소셜 미디어 사용자들은 일반적으로 분노, 두려움, 걱정, 혼란, 슬픔 등 부정적인 감정을 보였습니다.

한 조사에 따르면, 전 세계 인터넷 사용자가 소셜 미디어에 소비하는 평균 시간은 하루 2시간 22분입니다.소셜 미디어는 더 이상 사회적 기능에만 국한되지 않고, 많은 사람이 자신의 감정을 기록하고 내면의 생각을 표현하는 장소가 되었습니다.

국내 위챗 모먼츠, 웨이보, QQ스페이스 등이든, 국외 트위터, 인스타그램, 페이스북이든 모두 수천 명의 사용자를 보유하고 있습니다.

심리학 연구자들에게 소셜 미디어의 이러한 게시물은 의심할 여지 없이 상당한 양의 연구 데이터를 제공합니다.

최근 연구에서 스탠포드 대학의 요하네스 아이히슈타트 연구원과 미시간 대학의 에런 와이드먼 연구원은 자연어 처리 도구를 사용하여 Facebook 사용자의 게시물을 분석했습니다.

연구에 따르면 머신 러닝 모델은 전통적인 심리학 측정과 비슷한 정확도로 소셜 미디어를 통해 사람의 감정과 변화에 대한 통찰력을 제공할 수 있습니다.

당신의 기쁨, 슬픔, 분노, 행복을 그 줄에서 읽어보세요

최근 몇 년 동안 인터넷의 방대한 정보는 성격과학 분야의 중요한 데이터 원천이 되었습니다.많은 연구 결과에 따르면 소셜 미디어 프로필을 사용하여 성격 관련 측면을 분류하는 것이 효과적이라는 사실이 밝혀졌습니다.

아이히슈타트와 바이드먼의 최신 연구는 소셜 미디어 빅데이터 분석을 사용하여 사람들의 심리 상태를 추적하는 최첨단 사례를 제공합니다.

소셜 미디어 언어를 활용한 심리적 변동 추적: 주간 기분 변화를 기반으로 한 사례 연구

샘플링 교정 

저자들은 가치와 각성이라는 두 가지 기본적인 감정적 차원을 사용하여 Facebook 게시물의 감정을 평가했습니다.

참고: "가치"와 "각성"은 심리학에서 감정을 평가하는 두 가지 차원입니다. 전자는 긍정적/부정적 감정의 정도를 나타내며, 긍정적 감정과 부정적 감정을 구분합니다. 후자는 평온함/흥분의 정도를 나타냅니다.

그들은 먼저 심리학 배경을 가진 인간 연구 지원자들에게 이전 연구에서 공개된 2,895개의 Facebook 게시물에 주석을 달게 했습니다.

이 연구는 각 게시물의 "가치"와 "흥분"을 평가하는 데 도움이 되었습니다. 9점 척도를 사용했습니다(가치의 경우 1=부정적, 9=긍정적, 각성의 경우 1=낮음, 9=높음).

심리학 연구 조수들이 게시물에 "가치"와 "각성"에 대해 주석을 달았습니다.,감정 추적 데이터 세트가 공개되었습니다: https://osf.io/pbjer/files/

이러한 검토가 완료되면, 게시물을 사용하여 어떤 언어가 어떤 감정을 전달하는지 예측할 수 있는 머신 러닝 모델을 훈련시켰습니다.

그런 다음 저자는 이러한 평가 데이터에 일련의 모델을 적용했는데, 각 모델은 가치와 각성 사이에 명확한 연관성이 있음을 보여주었습니다.

국내 NLP 연구자들에게는 중국 감성 분석 데이터 세트가 더 적용 가능합니다.따라서 Super Neuro는 2014년 NLPCC의 중국 Weibo 감정 분석 데이터 세트를 권장합니다.

평가 데이터는 시나 웨이보에서 나왔습니다. Weibo 전체 입력에 대해, Weibo에 감정이 포함되어 있는지 여부를 판단하는 작업이 필요합니다. 감정이 담긴 마이크로블로그의 경우, 분노, 혐오, 두려움, 행복, 좋아요, 슬픔, 놀람 등의 감정 분류 결과를 식별해야 합니다.

데이터 세트 세부정보는 다음과 같습니다.

중국 Weibo 감정 분석 데이터 세트

제공된 데이터:NLPCC2014

출시 시간: 2014

포함된 수량:수십만 개의 마이크로블로그 텍스트 

데이터 형식:.xml

데이터 크기:18MB

다운로드 주소:https://orion.hyper.ai/datasets/14390

모델 생성 

이 팀은 DLATK(Differential Language Analysis ToolKit)를 사용하여 선택된 Facebook 게시물에서 언어적 특징을 추출했습니다. 단어와 구문의 상대적 빈도를 기준으로, 우연히 등장한 구문보다 3배 이상 자주 등장한 단어를 기억했습니다. 마지막으로, 1,439개의 문장 구성 요소가 필터링되어 "가치"를 예측하고, 675개의 문장 구성 요소가 필터링되어 "각성"을 예측했습니다.

그 다음에,"가치"와 "각성"을 예측하기 위해 전체 언어 기능 세트를 기반으로 능선 회귀 모델을 훈련합니다.10배 교차 검증이 사용되었습니다(즉, 모델은 90%의 데이터를 기반으로 구축된 다음 나머지 10%에 대해 평가되었습니다).

모델의 교차 검증 샘플 외부 예측 정확도는 다음과 같습니다. "가치"의 예측 정확도는 0.63입니다. "각성"의 정확도는 0.82입니다. 기존의 다른 표준 감정 측정법과 비교했을 때, 이 모델은 이러한 대체 측정법보다 더 정확하게 추정하는 것으로 나타났습니다.

검증 샘플 

이 모델을 테스트하기 위해 연구팀은 65,000개가 넘는 Facebook 게시물에서 640명의 미국 사용자를 표본으로 추출했으며, 표본의 수는 남성과 여성을 동일하게 했습니다. 사용자는 또한 다음 조건을 충족해야 했습니다. 최소 14주 연속으로 10개 이상의 상태 업데이트를 게시해야 했습니다.

최종적으로 연구팀은 이들 사용자가 게시한 게시물 303,575개를 검증 샘플로 수집했습니다.

실험 결과 

저자는 사용자의 감정 평가를 아래 그림과 같이 시각화했습니다. 이는 여성(왼쪽)과 남성(오른쪽)의 주간 기분과 각성 변동을 설명하고, 5가지 주요 성격 특성에 대한 예측을 보여줍니다.

참고사항: 5가지 주요 성격 특성은 현대 심리학에서 성격 특성을 설명하는 데 사용되는 구조적 모델입니다. 포함 사항: 외향성, 신경증, 친화성, 성실성, 경험에 대한 개방성.

수평축은 '밸런스' 값이고, 수직축은 '각성' 값입니다.

그림에서 볼 수 있듯이, 왼쪽의 여성 사용자는 감정적 변동이 더 크고, 높은 쾌감(Valence)과 높은 흥분(Arousal)의 빈도가 더 높습니다.

이와 대조적으로 오른쪽의 남성 사용자는 감정적 변화가 적고 높은 수준의 즐거움이나 흥분을 경험하는 경우가 거의 없습니다.

이는 연구팀의 실험에서 발견된 새로운 사실입니다. 여성은 남성보다 더 낙관적이고 감정의 폭이 더 넓은 경향이 있습니다. 이것은 다음과 유사합니다

또한 연구팀은 분석 결과 '가치'와 '각성' 가치와 5대 성격 특성 간의 상관관계도 발견했습니다.

모델 평가 

검증 샘플을 제공한 Facebook 사용자는 이전에 자발적으로 "나의 성격" 설문 조사에 참여했는데, 이 설문 조사는 자신의 5가지 주요 성격 특성을 평가하는 것이었습니다.

연구 결과에 따르면 머신 러닝 모델이 예측한 성격은 심리 설문 조사 방법을 사용하여 예측한 성격과 일치했습니다.

결함 분석 

물론 저자는 이 모델이 현재 가지고 있는 문제점도 지적합니다.

첫째, 그들은 비교적 활동적인 페이스북 사용자를 표본으로 사용했지만, 이들은 충분히 빈번한 상태 업데이트를 제공했기 때문에 선택되었지만, 모든 미국인을 대표하기는 어려울 가능성이 높습니다.

둘째, 다양한 소셜 플랫폼은 각기 다른 속성과 스타일을 가지고 있습니다. Facebook 게시물을 사용하여 얻은 결과를 Twitter 등 다른 소셜 미디어에서도 재현할 수 있는지는 아직 알려지지 않았습니다.

따라서 이러한 한계와 보편적인 문제는 연구자들이 앞으로 더욱 탐구해야 할 방향이기도 합니다.

소셜 플랫폼은 심리학에 무한한 잠재력을 가지고 있습니다.

아마도 많은 사람들에게 소셜 플랫폼은 단순히 삶을 공유하고, 아름다운 사진을 찍고, 가십을 읽는 장소에 불과할지도 모릅니다. 하지만 사실 소셜 플랫폼은 심리학 연구에 큰 잠재력을 가지고 있습니다.

데이터 마이닝과 머신 러닝을 통해 우리는 엄청난 양의 데이터에서 신호를 추출하고, 우울증과 불안과 같은 정서적 장애가 있는 사람들을 식별한 다음 적절한 치료 조치를 취할 수 있습니다. 이와 관련해 중국에는 이미 성숙한 사례가 있습니다.

네덜란드 암스테르담 브리예 대학교(Vrije Universiteit Amsterdam)의 인공지능 학자 황지성(Huang Zhisheng)은2018년에는 "나무 구멍 구조대"라는 AI 프로그램이 웨이보에 올라온 자살 관련 게시물을 검색하기 위해 만들어졌습니다.이후, "단서"를 통해 자살 생각을 가진 이용자의 위치를 파악하고, 구조대원을 적절한 시간에 파견해 이들을 찾아 안내하게 됩니다.

이 자원봉사자 팀은 지금도 심리상담의 최전선에서 활동하고 있습니다.

2020년 9월 말 현재, "트리홀 구조대"는 창설 이후 2년 동안 3,289건의 자살 시도를 예방했습니다.

또한 소셜 미디어 기반의 감성 분석 기술,또한 대지진, 전쟁, 코로나19 전염병 등의 충격적 사건이 사람들에게 미치는 심리적 영향을 추적하여 정부 부처가 여론 유도, 과학적 구조, 국민 감정 달래기 등의 작업을 효과적으로 수행하는 데 도움이 됩니다.

개인에 있어서는 미래에는 이런 도구를 이용해서 우리 남자친구/여자친구의 작은 감정까지 분석할 수 있을 텐데, 그러면 더 이상 추측할 필요가 없게 될 거예요~

뉴스 출처:

https://hai.stanford.edu/blog/can-artificial-intelligence-map-our-moods