LinCE 全称 Linguistic Code-switching Evaluation Dataset,是一个语言代码转换评估数据集。该数据集结合了十个语料库,涵盖四种不同的代码转换语言对(西班牙语-英语、尼泊尔语-英语、印地语-英语和现代标准阿拉伯语-埃及阿拉伯语)。该数据集完成四项任务,即语言识别、命名实体识别、语音部分标注和情绪分析。数据集还提供了不同流行型号的分数,包括 LSTM、ELMo 和多语言 BERT,以便 NLP 社区可以与最先进的系统进行比较。
LinCE 语言转换数据集
本站暂不支持该数据集下载,如需下载请访问上述「发布地址」进行下载(如可用)
感谢您下载 LinCE 语言转换数据集!
本站基于知识共享许可协议,为国内用户提供公开数据集高速下载,仅用于科研与学术交流。
获得数据集更新通知、下载过程发现问题、提供未引入数据集资源等,请关注公众号与我们沟通。
感谢您下载 LinCE 语言转换数据集!

相关数据集推荐
MELD 情绪识别数据集
MELD 全称 Multimodal EmotionLines Dataset,是通过增强和扩展 EmotionLines 数据集创建的。 MELD 数据集包含了 EmotionLines 中的相同对话实例,但它同时包含了其它模态的数据(音频、视频以及文本)。MELD …

IEMOCAP 情绪识别数据集
IEMOCAP 全称 the Interactive Emotional Dyadic Motion Capture,是一个多模态情绪识别数据集。 IEMOCAP 数据集由 151 个录制的对话视频组成,每个对话有 2 个发言人,整个数据集总共有 302 个视频。每个片段都标注了…

Multi-Domain Sentiment Dataset v2.0 多域情感分析数据集
Multi-Domain Sentiment Dataset 是一个多域情感分析数据集,它收集了来自亚马逊平台不同类别产品(即域)的评价,某些产品(如书籍和 DVD )有数十万条评论,其他产品(如乐器)评论数量只有几百条,这些买家评价包含了星级评分( 1 星-5 星)、买家用户名…