HyperAIHyperAI

Command Palette

Search for a command to run...

Few-NERD : Un jeu de données pour la reconnaissance de noms propres en peu de exemples

Ning Ding Guangwei Xu Yulin Chen Xiaobin Wang Xu Han Pengjun Xie Hai-Tao Zheng Zhiyuan Liu

Résumé

Récemment, une importante littérature s’est développée autour du thème de la reconnaissance de noms propres (NER) en peu d’exemples (few-shot NER), mais très peu de données de référence publiées se concentrent spécifiquement sur cette tâche pratique et exigeante. Les approches actuelles collectent des jeux de données supervisés existants pour la NER et les réorganisent dans un cadre peu d’exemples afin de mener des études empiriques. Ces stratégies visent traditionnellement à reconnaître des types d’entités grossiers à partir de très peu d’exemples, alors qu’en pratique, la plupart des types d’entités inconnus sont fins. Dans cet article, nous présentons Few-NERD, un grand jeu de données annoté manuellement pour la NER en peu d’exemples, comprenant une hiérarchie de 8 types d’entités grossiers et 66 types d’entités fins. Few-NERD comprend 188 238 phrases extraites de Wikipedia, soit un total de 4 601 160 mots, chacun annoté comme contexte ou comme partie d’un type d’entité à deux niveaux. À notre connaissance, il s’agit du premier jeu de données pour la NER en peu d’exemples et du plus grand jeu de données manuellement construit pour la NER. Nous avons conçu des tâches de référence aux emphases variées afin d’évaluer de manière exhaustive la capacité de généralisation des modèles. Des résultats empiriques étendus et une analyse approfondie montrent que Few-NERD constitue un défi réel, et que ce problème nécessite encore des recherches approfondies. Nous mettons Few-NERD à disposition publiquement à l’adresse suivante : https://ningding97.github.io/fewnerd/.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp