
数据集背景
《星球大战》是一个流行的电影系列,故事发生在遥远的银河系。这是前三部电影(第 4-6 集)角色之间的剧本对话合集。这些数据可以用于文本挖掘和语言学。
数据集内容
该数据包含 4 个文件 分别为:
SW_EpisodeIV.txt
。第四集的脚本:新希望,包含专栏 character
和 dialogue
。
SW_EpisodeV.txt
。第五集的脚本:帝国反击战,包含专栏 character
和 dialogue
。
SW_EpisodeVI.txt
。 第六集的脚本:绝地归来的脚本,包含专栏 character
和 dialogue
。
wordcloud_masks.zip
。 Zip 文件,包括用于 wocloud 的蒙版。
致谢
Gaston Sanchez 的输入文件可在此处获取。
星球大战归卢卡斯影业所有。
Star-Wars-Movie-Scripts.torrent
做种 2正在下载 0已完成 42总下载次数 55