
データセットの背景
スター・ウォーズは、はるか彼方の銀河系を舞台にした人気映画シリーズです。これは、最初の 3 つの映画 (エピソード 4 ~ 6) の登場人物間のスクリプト化された会話のコレクションです。これらのデータは、テキスト マイニングや言語学に使用できます。
データセットの内容
データには 4 つのファイルが含まれています。
SW_EpisodeIV.txt
。エピソード 4: 新たなる希望の台本 (コラムを含む) character
そして dialogue
。
SW_EpisodeV.txt
。エピソード 5: 帝国の逆襲の脚本 (コラムを含む) character
そして dialogue
。
SW_EpisodeVI.txt
。 エピソード VI の脚本: ジェダイの帰還の脚本 (コラムを含む) character
そして dialogue
。
wordcloud_masks.zip
。 wocloud 用のマスクを含む zip ファイル。
謝辞
ガストン・サンチェス 入力ファイルは次のとおりですここ得る。
スターウォーズが帰ってくるルーカスフィルム全て。
Star-Wars-Movie-Scripts.torrent
シーディング 2ダウンロード中 0ダウンロード完了 47総ダウンロード数 56