日期
机构
发布地址
www.kaggle.com
标签
分类
该数据集包含 2016 年平安夜和圣诞节期间超 50,000 条推文的元数据,第一个字段是推文的 ID,第二个字段是 HTML 元数据。研究人员通过用 Java 编写的网络爬虫获取了这些数据,建议使用 BeautifulSoup 或其他库来解析这些数据并从每条推文中提取信息。
数据集有助于观察关于推文中表情符号的使用情况、圣诞节的情感类型或圣诞节期间活跃 Twitter 用户的年龄或国籍的某种人口统计数据。