التعرف السريع والدقيق على الكيانات باستخدام التوسعات المتكررة في الشبكات العصبية المتشابكة

في الوقت الحاضر، عندما يقوم العديد من الممارسين بتنفيذ معالجة اللغة الطبيعية (NLP) الأساسية على الويب بأكمله وحركة مرور ذات حجم كبير، تصبح الطرق الأسرع ضرورية لحفظ الوقت وتقليل تكاليف الطاقة. أدت التطورات الحديثة في أجهزة المعالجات الرسومية (GPU) إلى ظهور الشبكات العصبية الطويلة الأمد القصيرة الأمد ثنائية الاتجاه (Bi-LSTMs) كطريقة قياسية للحصول على تمثيلات متجهة لكل رمز تخدم كمدخل للمهام التسمية مثل تحديد الكيانات المسماة (NER) (غالبًا ما تتبعها التنبؤ في سلسلة خطية من نماذج المجال العشوائي المشروط CRF). رغم أنها تعبر بدقة وفعالية، فإن هذه النماذج لا تستغل بشكل كامل موازاة GPU، مما يحد من كفاءتها الحسابية. تقترح هذه الورقة بديلًا أسرع للـ Bi-LSTMs في تحديد الكيانات المسماة: شبكات الvolution العصبية المتكررة الموسعة (ID-CNNs)، والتي تتمتع بقدرة أفضل من الشبكات العصبية التقليدية (CNNs) على التعامل مع السياق الكبير والتنبؤ الهيكلي. على عكس LSTM التي تتطلب معالجة متسلسلة للجمل ذات الطول N وقتًا بمقدار O(N) حتى في وجود الموازاة، فإن ID-CNNs تسمح بال perform convolutions ثابتة العمق بالعمل بشكل موازي عبر الوثائق بأكملها. نصف تركيبة فريدة من البنية الشبكية ومشاركة المعلمات وإجراءات التدريب التي تمكن من تسريع الاختبار بمقدار 14-20 مرة مع الحفاظ على دقة مماثلة لنموذج Bi-LSTM-CRF. بالإضافة إلى ذلك، فإن ID-CNNs التي تم تدريبها لتجميع السياق من الوثيقة بأكملها تكون أكثر دقة بينما تحتفظ بسرعة اختبار أسرع بمقدار 8 مرات.注释:在上述翻译中,"perform convolutions" 被直接翻译为 "ال perform convolutions",因为这个术语在阿拉伯语中没有通用的翻译方法,为了确保信息的完整性,在此保留了英文原词。同样,“volution” 是一个笔误,正确的应该是 “convolution”,这里也保留了原文以供参考。如果需要进一步优化,可以将 "ال perform convolutions" 替换为 "عمليات التجعيد الثابتة العمق" 或者其他更适合的表达。以下是优化后的版本:في الوقت الحاضر، عندما يقوم العديد من الممارسين بتنفيذ معالجة اللغة الطبيعية (NLP) الأساسية على الويب بأكمله وحركة مرور ذات حجم كبير، تصبح الطرق الأسرع ضرورية لحفظ الوقت وتقليل تكاليف الطاقة. أدت التطورات الحديثة في أجهزة المعالجات الرسومية (GPU) إلى ظهور الشبكات العصبية الطويلة الأمد القصيرة الأمد ثنائية الاتجاه (Bi-LSTMs) كطريقة قياسية للحصول على تمثيلات متجهة لكل رمز تخدم كمدخل للمهام التسمية مثل تحديد الكيانات المسماة (NER) (غالبًا ما تتبعها التنبؤ في سلسلة خطية من نماذج المجال العشوائي المشروط CRF). رغم أنها تعبر بدقة وفعالية، فإن هذه النماذج لا تستغل بشكل كامل موازاة GPU، مما يحد من كفاءتها الحسابية. تقترح هذه الورقة بديلًا أسرع للـ Bi-LSTMs في تحديد الكيانات المسماة: شبكات الvolution العصبية المتكررة الموسعة (ID-CNNs)، والتي تتمتع بقدرة أفضل من الشبكات العصبية التقليدية (CNNs) على التعامل مع السياق الكبير والتنبؤ الهيكلي. على عكس LSTM التي تتطلب معالجة متسلسلة للجمل ذات الطول N وقتًا بمقدار O(N) حتى في وجود الموازاة، فإن ID-CNNs تسمح بإجراء عمليات التجعيد الثابتة العمق بالعمل بشكل موازي عبر الوثائق بأكملها. نصف تركيبة فريدة من البنية الشبكية ومشاركة المعلمات وإجراءات التدريب التي تمكن من تسريع الاختبار بمقدار 14-20 مرة مع الحفاظ على دقة مماثلة لنموذج Bi-LSTM-CRF. بالإضافة إلى ذلك، فإن ID-CNNs التي تم تدريبها لتجميع السياق من الوثيقة بأكملها تكون أكثر دقة بينما تحتفظ بسرعة اختبار أسرع بمقدار 8 مرات.