HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données De Référence Sur La Capacité De Compréhension Du Contexte Long LooGLE

Date

il y a 2 ans

Size

80.66 MB

Organization

Paper URL

arxiv.org

Featured Image

Cet ensemble de données est un ensemble de données de référence, LooGLE, proposé par l'Institut d'intelligence artificielle générale de Pékin (GIAI) et l'équipe de l'Institut d'intelligence artificielle de l'Université de Pékin pour tester et évaluer les capacités de compréhension à long contexte des grands modèles de langage (LLM).

En évaluant les 9 LLM à texte long les plus populaires, LooGLE a constaté que les performances de ces modèles en matière de recherche multi-informations, de réorganisation temporelle, de calcul et de capacités de compréhension et de raisonnement dans des tâches complexes à longue dépendance ne sont pas optimistes. Les modèles commerciaux (Claude3-200k, GPT4-32k, GPT4-8k, GPT3.5-turbo-6k, LlamaIndex) ont une précision moyenne de seulement 40%, et les modèles open source (ChatGLM2-6B, LongLLaMa-3B, RWKV-4-14B-pile, LLaMA-7B-32K) ont une précision de seulement 10%.

Le document de recherche s'intitule «LooGLE : Les modèles de langage à contexte long peuvent-ils comprendre les contextes longs ?Cet article a été accepté par ACL2024. Les co-premiers auteurs sont Jiaqi Li et Mengmeng Wang de l'Institut des communications et des technologies de l'information, et les auteurs correspondants sont Zilong Zheng, chercheur à l'Institut des communications et des technologies de l'information, et Muhan Zhang, professeur adjoint à l'Université de Pékin.

LooGLE comble les lacunes des ensembles de données précédents en fournissant des textes ultra-longs, en utilisant des documents relativement récents et des tâches de dépendance véritablement longues soigneusement conçues et annotées. Le lancement de l'ensemble de données de référence LooGLE fournit non seulement de nouveaux outils pour évaluer et améliorer les LLM à texte long, mais offre également une nouvelle direction pour le développement de la technologie de traitement du langage par intelligence artificielle.

LooGLE.torrent
Seeding 1Downloading 0Completed 204Total Downloads 294
  • LooGLE/
    • README.md
      2.01 KB
    • README.txt
      4.02 KB
      • data/
        • LooGLE.zip
          80.66 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp