
摘要
我们提出了拉脱维亚微博饮食语料库(Latvian Twitter Eater Corpus),该语料库聚焦于食物、饮品、进食与饮水这一特定领域,涵盖超过8年的数据积累,包含超过200万条微博,并附带了多种有用的附加信息。我们进一步将语料库划分为两个子语料库:问答类微博子语料库与情感标注微博子语料库。通过对语料库内容的分析,我们展示了两个子语料库的实际应用价值,通过利用该语料库中的数据,训练了针对特定领域的问答系统与情感分析模型。
我们提出了拉脱维亚微博饮食语料库(Latvian Twitter Eater Corpus),该语料库聚焦于食物、饮品、进食与饮水这一特定领域,涵盖超过8年的数据积累,包含超过200万条微博,并附带了多种有用的附加信息。我们进一步将语料库划分为两个子语料库:问答类微博子语料库与情感标注微博子语料库。通过对语料库内容的分析,我们展示了两个子语料库的实际应用价值,通过利用该语料库中的数据,训练了针对特定领域的问答系统与情感分析模型。