※本データセットはオンライン利用に対応しておりますが、ここをクリックしてジャンプしてください。
このデータ セットには、2016 年のクリスマス イブとクリスマス当日の 50,000 件を超えるツイートのメタデータが含まれています。最初のフィールドはツイートの ID、2 番目のフィールドは HTML メタデータです。研究者らは、Java で書かれた Web クローラーを介してこのデータを取得し、データを解析して各ツイートから情報を抽出するために BeautifulSoup またはその他のライブラリを使用することを推奨しています。
このデータセットは、ツイートでの絵文字の使用状況、クリスマスの感情の種類、クリスマス中にアクティブな Twitter ユーザーの年齢や国籍など、ある種の人口統計データを観察するのに役立ちます。