نماذج الشبكات العصبية لتحديد التعبير البديل وتشابه النصوص الدلالي والاستدلال اللغوي الطبيعي وإجابة الأسئلة

في هذا البحث، نقوم بتحليل عدة تصاميم لشبكات العصبونات (والتغيرات عليها) لنمذجة أزواج الجمل ونقارن أدائها بشكل مكثف عبر ثماني مجموعات بيانات، تشمل تحديد التعبير المكافئ، تشابه النصوص الدلالي، استدلال اللغة الطبيعية، ومهمات الإجابة على الأسئلة. رغم أن معظم هذه النماذج قد ادعت تحقيق أفضل الأداء في مجالها، فإن البحوث الأصلية غالباً ما كانت تبلغ عن نتائج لمجموعة واحدة أو اثنتين من البيانات المختارة. نقدم دراسة منهجية ونظهر أن (i) ترميز المعلومات السياقية باستخدام LSTM والتفاعلات بين الجمل هي أمور حاسمة، (ii) لا يساعد Tree-LSTM كما كان يُزعم سابقاً ولكنه يحسن الأداء بشكل مفاجئ على مجموعات بيانات Twitter، (iii) يعتبر نموذج الاستدلال التتابعي المعزز هو الأفضل حتى الآن للمجموعات الكبيرة من البيانات، بينما يحقق نموذج التفاعل الكلماتي الثنائي أفضل الأداء عند توفر كمية أقل من البيانات. قمنا بإصدار تنفيذنا كأداة مفتوحة المصدر.