LinCE 全称 Linguistic Code-switching Evaluation Dataset,是一个语言代码转换评估数据集。该数据集结合了十个语料库,涵盖四种不同的代码转换语言对(西班牙语-英语、尼泊尔语-英语、印地语-英语和现代标准阿拉伯语-埃及阿拉伯语)。该数据集完成四项任务,即语言识别、命名实体识别、语音部分标注和情绪分析。数据集还提供了不同流行型号的分数,包括 LSTM、ELMo 和多语言 BERT,以便 NLP 社区可以与最先进的系统进行比较。
LinCE 语言转换数据集
本站暂不支持该数据集下载,如需下载请访问上述「发布地址」进行下载(如可用)
感谢您下载 LinCE 语言转换数据集!
本站基于知识共享许可协议,为国内用户提供公开数据集高速下载,仅用于科研与学术交流。
获得数据集更新通知、下载过程发现问题、提供未引入数据集资源等,请关注公众号与我们沟通。
感谢您下载 LinCE 语言转换数据集!

相关数据集推荐
CMU-MOSEI 情感分析数据集
CMU-MOSEI 全称 CMU Multimodal Opinion Sentiment and Emotion Intensity,是规模最大的三模态数据集,且具有情感和情绪两类标注。 CMU-MOSEI 数据集包含超过 65 小时的带标注视频,视频来自 1,000 多个演讲…

CH-SIMS 多模态分类数据集
CH-SIMS 是一个中文数据集,可用于单模态和多模态情感分析。该数据集包含 2,281个精炼的真实视频片段,其中有多模态和单模态标注。该数据集可用于研究各种模态之间的交互,或使用独立的单模态标注进行单模态情感分析。

IEMOCAP 情绪识别数据集
IEMOCAP 全称 the Interactive Emotional Dyadic Motion Capture,是一个多模态情绪识别数据集。 IEMOCAP 数据集由 151 个录制的对话视频组成,每个对话有 2 个发言人,整个数据集总共有 302 个视频。每个片段都标注了…
