Command Palette
Search for a command to run...
映画の感情データセット
Movie Feelingsは、映画が喚起する細かな感情を体系的に特徴付けるために設計された、映画感情特徴量のデータセットです。従来のデータセットのように肯定的感情と否定的感情、あるいは基本的な感情のみを分類する限界を克服しています。映画推薦システムの構築、視聴者評価予測、感情モデリング研究、感情理解タスクにおける自然言語処理(NLP)と大規模言語モデルの比較評価などに幅広く活用されています。また、様々な感情パターンと映画レビューの相関関係を分析するためにも利用でき、計算社会科学や映画・テレビデータ分析に重要なデータサポートを提供します。 このデータセットには、1920年から2024年までの期間にわたる、文化的に影響力のある代表的な映画1,500本が含まれており、疑念、恐怖、平静、嫌悪、連帯、喜びなど50種類の感情状態を網羅しています。データセットには、基本的な映画情報、評価データ、あらすじ、および3つの独立した感情特徴システム(F1/F2/F3)が含まれています。F1は映画レビューに基づく連続的な特徴システムであり、F2とF3はモデル推論に基づいて生成された上位3つの離散的な感情ラベルです。
感情特性システム
- F1(レビューベースの自然言語処理、感情特徴):88万件の映画レビューテキストに基づいて、感情シソーラスとのマッチングと統計分析により、50次元の連続的な感情強度特徴(0~1)を生成します。
- F2(Transformer、ストーリー理解のための感情的特徴):ゼロショット感情分類にBARTを使用し、意味的再編成のためにRoBERTaと組み合わせて、映画のあらすじの理解をモデル化し、50の感情から上位3つの感情をバイナリ特徴として選択します。
- F3(GPT-4o、生成感情特徴):GPT-4oをベースに、映画の筋書きから直接感情を推論し、50種類の感情の限定されたセットから上位3つの感情ラベルを生成し、それらをバイナリ特徴量に変換します。