HyperAIHyperAI
منذ 2 أشهر

التعلم التبايني الجوار لتمثيلات الوثائق العلمية باستخدام تضمين الاستشهادات

Malte Ostendorff; Nils Rethmeier; Isabelle Augenstein; Bela Gipp; Georg Rehm
التعلم التبايني الجوار لتمثيلات الوثائق العلمية باستخدام تضمين الاستشهادات
الملخص

يمكن تحسين تعلم تمثيلات الوثائق العلمية بشكل كبير من خلال أهداف التعلم المقارن، حيث يكمن التحدي في إنشاء عينات تدريبية إيجابية وسلبية ترميز معاني التشابه المرغوبة. تعتمد الدراسات السابقة على العلاقات الاستشهادية المنفصلة لتوليد العينات المقارنة. ومع ذلك، فإن الاستشهادات المنفصلة تفرض قطعًا صارمًا للتشابه، وهو ما يتعارض مع التعلم القائم على التشابه ويتجاهل أن الأوراق العلمية يمكن أن تكون متشابهة جدًا رغم عدم وجود استشهاد مباشر بينها - وهو مشكلة أساسية في العثور على الأبحاث ذات الصلة. بدلاً من ذلك، نستخدم تقنية العينة الأقرب الجارة المراقبة على تمثيلات الرسم البياني الاستشهادي للتعلم المقارن. يتيح هذا التحكم لنا تعلم التشابه المستمر، واختيار عينات سلبية وإيجابية صعبة التعلم، وكذلك تجنب الاصطدام بين العينات السلبية والإيجابية عن طريق ضبط الهامش بينهما. أدت الطريقة الناتجة SciNCL إلى تحقيق نتائج أفضل من الحالة المتقدمة حاليًا في معيار SciDocs. بالإضافة إلى ذلك، نوضح أنها يمكن أن تقوم بتدريب (أو ضبط) النماذج بكفاءة عالية باستخدام عدد أقل من العينات، وأنها يمكن دمجها مع طرق التدريب الحديثة ذات الكفاءة العالية. ربما بشكل مفاجئ، حتى تدريب نموذج لغوي عام بهذه الطريقة يؤدي إلى تحقيق نتائج أفضل من النماذج التي تم تدريبها مسبقًا ضمن المجال نفسه.

التعلم التبايني الجوار لتمثيلات الوثائق العلمية باستخدام تضمين الاستشهادات | أحدث الأوراق البحثية | HyperAI