HyperAI

مجموعة بيانات تحويل اللغة LinCE

التاريخ

منذ 3 أعوام

المؤسسة

رابط النشر

ritual.uh.edu

مساعدة التنزيل
特色图像

LinCE تعني Linguistic Code-switching Evaluation Dataset (مجموعة بيانات تقييم تحويل الكود اللغوي)، وهي مجموعة بيانات لتقييم تحويل الكود اللغوي. تجمع مجموعة البيانات عشر مجموعات من النصوص تغطي أربعة أزواج مختلفة من لغات التبديل الرمزي (الإسبانية-الإنجليزية، النيبالية-الإنجليزية، الهندية-الإنجليزية، والعربية القياسية الحديثة-العربية المصرية). تستكمل مجموعة البيانات أربع مهام، وهي تحديد اللغة، والتعرف على الكيان المسمى، ووضع علامات على جزء من الكلام، وتحليل المشاعر. توفر مجموعة البيانات أيضًا درجات لنماذج شائعة مختلفة، بما في ذلك LSTM، وELMo، وBERT متعدد اللغات، حتى يتمكن مجتمع معالجة اللغة الطبيعية من المقارنة مع الأنظمة الحديثة.