HyperAIHyperAI
منذ 2 أشهر

نهج قوي ومتكيف مع المجال للاعتراف بالكيانات المسماة ذات الموارد المنخفضة

Houjin Yu; Xian-Ling Mao; Zewen Chi; Wei Wei; Heyan Huang
نهج قوي ومتكيف مع المجال للاعتراف بالكيانات المسماة ذات الموارد المنخفضة
الملخص

في الآونة الأخيرة، لفت اهتمامًا كبيرًا بناء أنظمة موثوقة للتعرف على الكيانات المسماة (NER) باستخدام بيانات مُشَرَّحة محدودة. تعتمد几乎所有现有的研究工作都严重依赖特定领域的资源,例如外部词汇表和知识库。但是,这些特定领域的资源通常不可用,同时构建这些资源既困难又昂贵,这已成为更广泛采用的关键障碍。为了解决这一问题,本文提出了一种新的鲁棒且领域适应的方法——RDANER,用于低资源NER,该方法仅使用廉价且容易获取的资源。在三个基准数据集上进行的大量实验表明,当仅使用廉价且容易获取的资源时,我们的方法实现了最佳性能,并且与使用难以获取的领域特定资源的最先进方法相比具有竞争力的结果。我们所有的代码和语料库都可以在 https://github.com/houking-can/RDANER 找到。修正后的翻译:في الفترة الأخيرة، حظي بناء أنظمة موثوقة للتعرف على الكيانات المسماة (NER) باستخدام بيانات مشروحة بشكل محدود باهتمام كبير. تعتمد几乎所有现有的研究工作几乎完全依赖于特定领域的资源,如外部词汇表和知识库。然而، هذه الموارد الخاصة بالحقل غالبًا ما تكون غير متاحة، كما أنها صعبة وغالية الثمن في البناء، مما أصبح عائقًا رئيسيًا أمام التبني الأوسع. لمعالجة هذه المشكلة، نقترح في هذا العمل منهجية جديدة قوية وقابلة للتكيف مع الحقول المختلفة تُسمى RDANER لـ NER ذات الموارد المحدودة، والتي تستعمل فقط الموارد الرخيصة والسهلة الحصول عليها. أظهرت التجارب الواسعة التي أجريت على ثلاثة مجموعات بيانات مرجعية أن منهجيتنا تحقق أفضل الأداء عند استخدامها مع الموارد الرخيصة والسهلة الحصول عليها فحسب، وتقدم نتائج تنافسية مقابل أفضل الأساليب الحالية التي تستعمل الموارد الخاصة بالحقل الصعبة الحصول عليها. يمكن العثور على جميع كود البرمجة ومجموعات البيانات الخاصة بنا على الرابط https://github.com/houking-can/RDANER.再次修正以确保完全符合阿拉伯语表达习惯:في الفترة الأخيرة، حظي بناء أنظمة موثوقة للتعرف على الكيانات المسماة (NER) باستخدام بيانات مشروحة بشكل محدود باهتمام كبير. تعتمد معظم الأعمال الموجودة حاليًا بشكل كبير على موارد خاصة بالحقل، مثل القواميس الخارجية وقواعد المعرفة. ومع ذلك، فإن هذه الموارد الخاصة بالحقل غالبًا ما تكون غير متاحة، كما أنها صعبة وغالية الثمن في البناء، مما أصبح عائقًا رئيسيًا أمام التبني الأوسع. لمعالجة هذه المشكلة، نقترح في هذا البحث منهجية جديدة قوية وقابلة للتكيف مع الحقول المختلفة تُسمى RDANER لـ NER ذات الموارد المحدودة، والتي تستعمل فقط الموارد الرخيصة والسهلة الحصول عليها. أظهرت التجارب الواسعة التي أجريت على ثلاثة مجموعات بيانات مرجعية أن منهجيتنا تحقق أفضل الأداء عند استخدامها مع الموارد الرخيصة والسهلة الحصول عليها فحسب، وتقدم نتائج تنافسية مقابل أفضل الأساليب الحالية التي تستعمل الموارد الخاصة بالحقل الصعبة الحصول عليها. يمكن العثور على جميع كود البرمجيات ومجموعات البيانات الخاصة بنا على الرابط https://github.com/houking-can/RDANER.

نهج قوي ومتكيف مع المجال للاعتراف بالكيانات المسماة ذات الموارد المنخفضة | أحدث الأوراق البحثية | HyperAI