中文微博情感分析数据集

日期

3 年前

许可协议

非商业用途

下载帮助

数据集来自于 2014 NLPCC(自然语言处理与中文计算会议),是由中国计算机学会(CCF)主办的 CCF 中文信息技术专业委员会年度学术会议。

评测数据来自新浪微博,对包含情绪的微博,可以判别其情绪分类输出为 anger 愤怒、 disgust 厌恶、 fear 恐惧、 happiness 高兴、 like 喜好、 sadness 悲伤、 surprise 惊讶。

数据格式为 xml 格式,编码为 Unicode(utf-16),包含:emotion classification,emotion classification ID,emotion expression identification,expression ID 文件。