Command Palette
Search for a command to run...
Movie Feelings 电影情感特征数据集
Movie Feelings 是一个电影情感特征数据集,旨在系统刻画电影所引发的细粒度情绪(feelings)特征,突破传统仅基于正负面情感或基础情绪分类的局限,广泛应用于电影推荐系统构建、观众评分预测、情绪建模研究,以及 NLP 与大语言模型在情绪理解任务中的对比评估,同时也可用于分析不同情绪模式与电影口碑之间的关联关系,为计算社会科学与影视数据分析提供重要数据支撑。 该数据集包含 1,500 部具有代表性且具有文化影响力的电影,时间跨度为 1920 年至 2024 年,覆盖怀疑、恐惧、平静、厌恶、团结、欣喜等 50 种情感状态。数据集包括电影基础信息、评分数据、剧情文本,以及三套独立情绪特征体系(F1/F2/F3):其中 F1 为基于影评的连续型特征,F2 与 F3 为基于模型推理生成的 Top 3 离散情绪标记。
情绪特征体系
- F1(Review-Based NLP,情绪特征):基于 88 万条电影影评文本构建,通过情绪同义词词典进行匹配统计,生成 50 维连续型情绪强度特征(0–1)。
- F2(Transformer,剧情理解情绪特征):使用 BART 进行零样本情绪分类,并结合 RoBERTa 进行语义重排序,对电影剧情摘要进行理解建模,从 50 种情绪中选取 Top-3 情绪作为二值特征。
- F3(GPT-4o,生成式情绪特征):基于 GPT-4o 直接对电影剧情进行情绪推理,在限定的 50 种情绪集合中生成 Top-3 情绪标签,并转化为二值特征。