التاريخ

منذ 2 أعوام

الحجم

80.66 MB

المؤسسة

رابط الورقة البحثية

arxiv.org

الوسوم

LLM

معالجة اللغة الطبيعية

المعايير

تُعد مجموعة البيانات هذه مجموعة بيانات مرجعية، LooGLE، اقترحها معهد بكين للذكاء الاصطناعي العام (GIAI) وفريق معهد الذكاء الاصطناعي بجامعة بكين لاختبار وتقييم قدرات فهم السياق الطويل للنماذج اللغوية الكبيرة (LLMs). من خلال تقييم نماذج LLM التسعة الأكثر شيوعًا للنصوص الطويلة، وجدت LooGLE أن أداء هذه النماذج في استرجاع المعلومات المتعددة، وإعادة ترتيب الوقت، والحساب، وقدرات الفهم والاستدلال في المهام المعقدة ذات الاعتماد الطويل ليس متفائلاً. تتمتع النماذج التجارية (Claude3-200k، GPT4-32k، GPT4-8k، GPT3.5-turbo-6k، LlamaIndex) بدقة متوسطة تبلغ 40% فقط، وتتمتع النماذج مفتوحة المصدر (ChatGLM2-6B، LongLLaMa-3B، RWKV-4-14B-pile، LLaMA-7B-32K) بدقة تبلغ 10% فقط. عنوان البحث هو "LooGLE: هل تستطيع نماذج اللغة ذات السياق الطويل فهم السياقات الطويلة؟تم قبول هذه الورقة البحثية من قِبل ACL2024. المؤلفان الرئيسيان المشاركان هما جياكي لي ومينغ مينغ وانغ من معهد الاتصالات وتكنولوجيا المعلومات، والمؤلفان المراسلان هما زيلونغ تشنغ، الباحث في معهد الاتصالات وتكنولوجيا المعلومات، وموهان تشانغ، الأستاذ المساعد في جامعة بكين. يعالج LooGLE أوجه القصور في مجموعات البيانات السابقة من خلال توفير نصوص طويلة للغاية، واستخدام مستندات حديثة نسبيًا، ومهام طويلة حقًا مصممة وموضحة بعناية. إن إطلاق مجموعة بيانات معيار LooGLE لا يوفر أدوات جديدة لتقييم وتحسين لغات النصوص الطويلة فحسب، بل يوفر أيضًا اتجاهًا جديدًا لتطوير تقنية معالجة اللغة بالذكاء الاصطناعي.

الاستشهاد

@article{li2023loogle, title={LooGLE: هل تستطيع نماذج اللغة ذات السياق الطويل فهم السياقات الطويلة؟}, المؤلف={لي، جياكي ووانغ، مينغمينغ وتشنغ، زيلونغ وتشانغ، موهان} journal={arXiv preprint arXiv:2311.04939}, year={2023} }

LooGLE.torrent

البذر 1جارٍ التنزيل 0مكتمل 246إجمالي التنزيلات 343

LooGLE/
- README.md
  2.01 KB
- README.txt
  4.02 KB

تم المساهمة بهذه المجموعة من البيانات من قبل مستخدمي المجتمع وهي مخصصة للأغراض التعليمية والإعلامية فقط. إذا كان أي محتوى ينطوي على انتهاك لحقوق النشر، يرجى الاتصال بنا على [email protected] للمراجعة والإزالة الفورية.

مجموعات البيانات ذات الصلة

مجموعة بيانات مرجعية لفهم تغيرات المناطق عن بعد من مركز أبحاث الاستشعار عن بعد (RSRCC)

منذ 9 أيام

مجموعة بيانات تقييم قدرة تحليل الوسائط المتعددة OmniParsingBench

منذ 9 أيام

مجموعة بيانات MDPBench المعيارية لتحليل المستندات متعددة اللغات

منذ 9 أيام

مجموعة بيانات نموذج العالم

منذ 2 أشهر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار