6 个月前

摘要

我们提出了拉脱维亚微博饮食语料库（Latvian Twitter Eater Corpus），该语料库聚焦于食物、饮品、进食与饮水这一特定领域，涵盖超过8年的数据积累，包含超过200万条微博，并附带了多种有用的附加信息。我们进一步将语料库划分为两个子语料库：问答类微博子语料库与情感标注微博子语料库。通过对语料库内容的分析，我们展示了两个子语料库的实际应用价值，通过利用该语料库中的数据，训练了针对特定领域的问答系统与情感分析模型。

源 PDF