人間の喜びと悲しみは同じではありませんが、感情分析モデルはそれらを理解できます。

今日、ソーシャルメディアは徐々に人々の生活の一部となり、心理学者が研究を行うための重要なデータ源にもなりました。同時に研究者らは、自然言語処理や機械学習技術を利用してソーシャルメディアユーザーの感情の変動を予測しようとしている。
昨年の突然の新型コロナウイルス感染症の流行は、人々の生活に大きな影響を与えました。この特別な歴史的時期に、大衆の心理は敏感かつ脆弱になっています。
流行中は外出や接触が減り、人々はソーシャルネットワークに費やす時間が増えた。どうしても仕事や生活上の不満をインターネットを通じて他人にぶつけてしまう人がいます。パニック、不安、悲しみ、無力感などの否定的な感情も増加しています。

調査によると、世界中のインターネット ユーザーは毎日平均 2 時間 22 分をソーシャル メディアに費やしています。ソーシャルメディアはもはやソーシャル機能に限定されず、多くの人が自分の気分を記録したり、懸念事項を話し合ったりする場所にもなりました。
国内の WeChat Moments、Weibo、QQ Zone などであっても、海外の Twitter、Instagram、Facebook であっても、それらはすべて数千のユーザーのステータスを保持しています。
心理学の研究者にとって、これらのソーシャル メディアの投稿は間違いなく大量の研究データを提供します。
スタンフォード大学の研究者ヨハネス・アイヒシュテット氏とミシガン大学のアーロン・ワイドマン氏は、最新の研究で自然言語処理ツールを使用してFacebookユーザーの投稿を分析した。
研究によると、機械学習モデルは、従来の心理学の測定に匹敵する精度で、ソーシャル メディアを通じて人の感情や変動についての洞察を得ることができます。
行間を読んで自分の感情を理解する
近年、インターネット上の大量の情報がパーソナリティ科学の重要なデータ源となっています。多くの研究により、ソーシャル メディア プロフィールを使用して性格の関連する側面を分類することの有効性が実証されています。
アイヒシュテット氏とワイドマン氏による最新の研究は、ソーシャルメディアのビッグデータを利用して人々の心理状態を分析、追跡する最先端の事例を提供している。

サンプリング校正
著者らは、「価度」と「興奮」という 2 つの基本的な感情の側面を使用して、Facebook 上の投稿の感情を評価しています。
注:「価性」と「興奮」は、心理学における感情を評価するための 2 つの次元であり、前者はポジティブな感情とネガティブな感情を区別し、後者は冷静さ/興奮の度合いを表します。
彼らはまず、心理学の訓練を受けた人間の研究助手に、以前の研究で公開された Facebook の投稿 2,895 件に注釈を付けるよう依頼しました。
調査は、各投稿の魅力と興奮をスコアリングするのに役立ちます。 9 段階のスケールを使用します (「価度」の場合は 1 = 「ネガティブ」、9 = 「ポジティブ」、同様に「覚醒」の場合は 1 = 「低」、9 = 「高」)。

これらの評価が完了すると、投稿は、どの言語がどの感情を伝えるかを予測できる機械学習モデルのトレーニングに使用されます。
次に、著者らはこれらの評価データに一連のモデルを当てはめ、それぞれのモデルで、価度と覚醒の間の明確な関連性の可能性を示しました。
国内の NLP 研究者にとっては、中国の感情分析データセットの方が適しています。したがって、Super Neural では、2014 年の NLPCC による中国の Weibo センチメント分析データ セットを推奨しています。
評価データは Sina Weibo から取得され、入力された Weibo 全体について、このタスクでは Weibo に感情が含まれているかどうかを判断する必要があります。感情を含む Weibo の場合、感情分類出力が怒り、嫌悪、恐怖、幸福、好き、悲しみ、驚きであることを識別する必要があります。
データセットの詳細は次のとおりです。
中国の Weibo センチメント分析データセット
提供されるデータ:NLPCC2014
リリース時間:2014年
含まれる数量:何十万ものWeiboテキスト
データ形式:.xml
データサイズ:18MB
ダウンロードアドレス:https://orion.hyper.ai/datasets/14390
モデルの作成
チームは、Differential Language Analysis ToolKit (DLATK) を使用して、選択した Facebook 投稿の言語的特徴を、単語やフレーズの相対頻度に基づいて抽出しました。チャンス。最後に、1,439 個の文コンポーネントが「価度」を予測するために除外され、675 個の文コンポーネントが「覚醒」を予測するために使用されました。
それから、言語特徴セット全体に基づいてリッジ回帰モデルをトレーニングし、「価性」と「覚醒」を予測します。そして、10 分割相互検証を使用します (つまり、90% のデータに基づいてモデルを構築し、残りの 10% でそれを評価します)。
このモデルの相互検証されたサンプル外予測精度は次のとおりです。「価度」予測精度は 0.63、「覚醒」予測精度は 0.82 です。以前の感情の他の標準的な尺度と比較すると、このモデルはこれらの代替尺度よりも正確に推定できることがわかりました。
検証サンプル
モデルをテストするために、研究チームは 65,000 件を超える Facebook の投稿から、男女同数の 640 人のアメリカ人ユーザーを抽出しました。満たす必要がある条件は、少なくとも 14 週間連続して 10 を超えるステータスを投稿することです。 。
最終的に、研究チームはこれらのユーザーが投稿した 303,575 件の投稿を検証サンプルとして収集しました。
実験結果
著者らは、以下の図に示すように、ユーザーの感情評価を視覚化しました。これは、女性 (左) と男性 (右) の毎週の気分と覚醒の変動、およびビッグ 5 の性格特性の予測を示しています。
注: ビッグ 5 の性格特性は、現代心理学で性格特性を説明するために使用される構造モデルです。外向性、神経症傾向、協調性、誠実性、経験への寛容さが含まれます。

写真からわかるように、左側の女性ユーザーは気分の変動が大きく、高い快感 (Valence) と高い興奮 (Arousal) の頻度が高くなります。
対照的に、右側の男性ユーザーは気分の変動が小さく、非常に楽しい感情や非常に興奮した感情を経験することはほとんどありません。
これはチームの実験での新たな発見でもある。女性は男性よりも楽観的で、気分の変動幅が広い傾向があるという。これに関連するのは、
さらに、チームの分析では、「価性」と「覚醒」の値とビッグファイブの性格との間に相関関係があることも判明しました。
モデルの評価
検証サンプルを提供した Facebook ユーザーは、以前に自分の 5 つの主要な性格特性を評価する「私の性格」アンケートに自発的に参加していました。
その結果、機械学習モデルによる彼らの性格の予測は、心理調査手法を使用した予測と一致していることがわかりました。
欠陥解析
もちろん、著者はこのモデルの現状の問題点も指摘しています。
まず、比較的アクティブな Facebook ユーザーをサンプリングしましたが、これらのユーザーは十分な頻度でステータス更新を提供するため選ばれましたが、すべてのアメリカ人を代表しているとは考えられませんでした。
第二に、ソーシャル プラットフォームが異なれば、属性やスタイルも異なります。Facebook の投稿を使用して得られた結果が、Twitter などの異なるソーシャル メディアでも再現できるかどうかはまだ不明です。
したがって、これらの限界と普遍的な問題は、研究者が将来さらに探究すべき方向性でもあります。
心理学向けのソーシャル プラットフォームには無限の可能性があります
おそらく多くの人にとって、ソーシャル プラットフォームは人生や美しい写真を共有したり、ゴシップを読んだりするための場所にすぎませんが、実際には心理学研究において大きな可能性を秘めています。
データマイニングと機械学習を通じて、膨大なデータからシグナルを抽出して、うつ病、不安症、その他の感情障害に苦しんでいる人々を特定し、タイムリーに治療措置を講じることができます。この点に関して、中国ではすでに成熟した事例が存在する。
オランダのアムステルダム自由大学の人工知能学者、黄志生氏は次のように述べています。2018年に彼は、Weibo上の自殺関連の投稿を検索する「Tree Hole Rescue Team」というAIプログラムを作成した。そして、「手がかり」を使って自殺願望のある利用者を探し出し、救助ボランティアを速やかに派遣して捜索・指導を行います。
現在、このボランティアチームは心理カウンセリングの最前線で活躍しています。

また、ソーシャルメディアを活用した感情分析技術や、また、トラウマ的な出来事(大地震、戦争、新型コロナウイルス感染症の流行など)が人々に及ぼす心理的影響を追跡することもできるため、政府部門が世論誘導、科学的救助、国民感情の鎮静化を効果的に実施するのに役立ちます。
個人に関しては、将来的にはこれらのツールを使用して彼氏/彼女の感情を分析できるようになり、誰もが推測する必要がなくなるかもしれません~

ニュースソース:
https://hai.stanford.edu/blog/can-artificial-intelligence-map-our-moods