自動的な性格予測;アンサンブルモデリングを用いた改良手法

人的性格在很大程度上通过其言语或书写中使用的词汇来体现。随着信息基础设施(特别是互联网和社交媒体)的普及,人类交流方式已显著从面对面交流转变为其他形式。自动性格预测(或感知)(APP) 是指利用人类生成或交换的各种内容(如文本、语音、图像、视频等)自动化预测性格的过程。本研究的主要目标是提高基于文本的APP的准确性。为此,我们提出了五种新的APP方法,包括基于词频向量的方法、基于本体论的方法、增强型本体论方法、潜在语义分析(LSA)方法以及基于深度学习的双向长短期记忆网络(BiLSTM)方法。这些基本方法通过基于层次注意力网络(HAN)作为元模型的集成建模(堆叠)相互补充,以提高APP的准确性。结果显示,集成建模提高了APP的准确性。日本語訳:人間の性格は、その人が話したり書いたりする言葉によって大きく表現される。情報インフラストラクチャ(特にインターネットとソーシャルメディア)の普及に伴い、人間のコミュニケーションは顔を合わせて行うものから著しく変化した。自動性格予測(または認識)(Automatic Personality Prediction (APP)) とは、人間が生成または交換する様々なコンテンツ(テキスト、音声、画像、動画など)を利用して性格を自動的に予測することである。本研究の主要な目的は、テキストに基づくAPPの精度を向上させることである。この目的達成のために、我々は5つの新しいAPP手法を提案する。それらは以下の通りである:語彙頻度ベクトルに基づく手法、オントロジーに基づく手法、強化されたオントロジーに基づく手法、潜在意味分析(Latent Semantic Analysis (LSA))に基づく手法および深層学習に基づく双方向長短期記憶ネットワーク(Bidirectional Long Short-Term Memory (BiLSTM))手法である。これらの基本的な手法は階層的注意ネットワーク(Hierarchical Attention Network (HAN))をメタモデルとして用いた集成モデリング(スタック)により互いに補完し合い、APPの精度向上に貢献する。結果は集成モデリングがAPPの精度を向上させることを示している。