*이 데이터 세트는 온라인 사용을 지원합니다.여기를 클릭하여 이동하세요.
이 데이터 세트에는 2016년 크리스마스 이브와 크리스마스 당일에 작성된 50,000개 이상의 트윗에 대한 메타데이터가 포함되어 있습니다. 첫 번째 필드는 트윗의 ID이고 두 번째 필드는 HTML 메타데이터입니다. 연구자들은 Java로 작성된 웹 크롤러를 사용하여 이 데이터를 얻었으며 BeautifulSoup이나 다른 라이브러리를 사용하여 데이터를 구문 분석하고 각 트윗에서 정보를 추출할 것을 권장했습니다.
이 데이터 세트는 트윗에서 이모티콘 사용, 크리스마스와 관련된 감정 유형, 크리스마스 기간 동안 트위터를 활발하게 사용하는 사용자의 연령이나 국적 등에 대한 인구 통계학적 데이터를 관찰하는 데 도움이 될 수 있습니다.