HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 3 أشهر

تطوير نماذج الإجابة على الأسئلة في اللغات ذات الموارد المحدودة: دراسة حالة على النصوص الطبية التركية باستخدام النهج القائمة على المحولات

{Murat Aydogan Mert Incidelen}

الملخص

في هذه الدراسة، تم تدريب نماذج اللغة المُدرّبة مسبقًا المستندة إلى المحولات (Transformer-based pre-trained language models) باستخدام نصوص طبية لمهام الإجابة على الأسئلة (QA) باللغة التركية، وهي لغة منخفضة الموارد. تم استخدام نماذج متنوعة من نموذج BERTurk المُدرّب مسبقًا، الذي تم إنشاؤه باستخدام مجموعة كبيرة من النصوص التركية، لأغراض مهام الإجابة على الأسئلة. وتُقدّم الدراسة مجموعة بيانات للإجابة على الأسئلة باللغة التركية في المجال الطبي، تم إنشاؤها باستخدام ويكيبيديا التركية والرسائل العلمية الطبية المتاحة في مركز الرسائل التابع للمجلس الأعلى للتعليم العالي في تركيا. وتضم هذه المجموعة ما مجموعه 8200 زوجًا من السؤال والإجابة، وتُستخدم لتدريب نموذج BERTurk. وقد تم تقييم أداء النماذج باستخدام معياري "التطابق الدقيق" (Exact Match - EM) و"دقة F1". وقد حقق نموذج BERTurk (مع الحروف الكبيرة، 32 ألفًا) نتيجة EM قدرها 51.097 ودقة F1 قدرها 74.148، بينما حقق نموذج BERTurk (مع الحروف الكبيرة، 128 ألفًا) نتيجة EM قدرها 55.121 ودقة F1 قدرها 77.187. وتُظهر النتائج أن النماذج المُدرّبة مسبقًا يمكن استخدامها بنجاح في مهام الإجابة على الأسئلة باللغات منخفضة الموارد مثل اللغة التركية. وتُعد هذه الدراسة أساسًا مهمًا لمعالجة النصوص الطبية باللغة التركية ومهام الإجابة التلقائية على الأسئلة، كما تُسلط الضوء على الاتجاهات المستقبلية في هذا المجال.

المعايير القياسية

معيار قياسيالمنهجيةالمقاييس
question-answering-on-medturkquad-medicalBERTurk (cased, 128k)
Exact Match: 55.121
F1 Score: 77.187
question-answering-on-medturkquad-medicalBERTurk (cased, 32k)
Exact Match: 51.097
F1 Score: 74.148

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
تطوير نماذج الإجابة على الأسئلة في اللغات ذات الموارد المحدودة: دراسة حالة على النصوص الطبية التركية باستخدام النهج القائمة على المحولات | الأوراق البحثية | HyperAI