HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات معيارية لقدرة فهم السياق الطويل لـ LooGLE

التاريخ

منذ عام واحد

الحجم

80.66 MB

المؤسسة

رابط الورقة البحثية

arxiv.org

العلامات

Featured Image

تُعد مجموعة البيانات هذه مجموعة بيانات مرجعية، LooGLE، اقترحها معهد بكين للذكاء الاصطناعي العام (GIAI) وفريق معهد الذكاء الاصطناعي بجامعة بكين لاختبار وتقييم قدرات فهم السياق الطويل للنماذج اللغوية الكبيرة (LLMs).

من خلال تقييم نماذج LLM التسعة الأكثر شيوعًا للنصوص الطويلة، وجدت LooGLE أن أداء هذه النماذج في استرجاع المعلومات المتعددة، وإعادة ترتيب الوقت، والحساب، وقدرات الفهم والاستدلال في المهام المعقدة ذات الاعتماد الطويل ليس متفائلاً. تتمتع النماذج التجارية (Claude3-200k، GPT4-32k، GPT4-8k، GPT3.5-turbo-6k، LlamaIndex) بدقة متوسطة تبلغ 40% فقط، وتتمتع النماذج مفتوحة المصدر (ChatGLM2-6B، LongLLaMa-3B، RWKV-4-14B-pile، LLaMA-7B-32K) بدقة تبلغ 10% فقط.

الورقة البحثية "LooGLE: هل تستطيع نماذج اللغة ذات السياق الطويل فهم السياقات الطويلة؟" تم قبوله من قبل ACL2024. المؤلفون المشاركون في هذه الورقة البحثية هم لي جيا تشي ووانغ مينجمينج من معهد أبحاث الاتصالات، والمؤلفون المراسلون هم تشنغ زيلونج، باحث في معهد أبحاث الاتصالات، وتشانغ موهان، أستاذ مساعد في جامعة بكين.

يعالج LooGLE أوجه القصور في مجموعات البيانات السابقة من خلال توفير نصوص طويلة للغاية، واستخدام مستندات حديثة نسبيًا، ومهام طويلة حقًا مصممة وموضحة بعناية. إن إطلاق مجموعة بيانات معيار LooGLE لا يوفر أدوات جديدة لتقييم وتحسين لغات النصوص الطويلة فحسب، بل يوفر أيضًا اتجاهًا جديدًا لتطوير تقنية معالجة اللغة بالذكاء الاصطناعي.

LooGLE.torrent
البذر 1التنزيل 0مكتمل 181إجمالي التنزيلات 265
  • LooGLE/
    • README.md
      2.01 KB
    • README.txt
      4.02 KB
      • data/
        • LooGLE.zip
          80.66 MB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
مجموعة بيانات معيارية لقدرة فهم السياق الطويل لـ LooGLE | مجموعات البيانات | HyperAI