il y a 7 mois

Résumé

La raisonnement basé sur le sens commun est un défi de longue date pour l'apprentissage profond. Par exemple, il est difficile d'utiliser des réseaux de neurones pour traiter le jeu de données Winograd Schema (Levesque et al., 2011). Dans cet article, nous présentons une méthode simple pour effectuer un raisonnement basé sur le sens commun avec des réseaux de neurones, en utilisant l'apprentissage non supervisé. L'élément clé de notre méthode est l'utilisation de modèles linguistiques, formés sur une quantité massive de données non étiquetées, pour évaluer les questions à choix multiples posées par les tests de raisonnement basé sur le sens commun. Sur les défis de la désambiguïsation des pronoms et du jeu de données Winograd Schema, nos modèles surpassent largement les méthodes précédentes d'état de l'art, sans utiliser des bases de connaissances annotées coûteuses ou des caractéristiques conçues manuellement. Nous entraînons une série de grands modèles linguistiques RNN qui fonctionnent au niveau des mots ou des caractères sur LM-1-Billion, CommonCrawl, SQuAD, les livres de Gutenberg et un corpus personnalisé pour cette tâche, et montrons que la diversité des données d'entraînement joue un rôle important dans les performances aux tests. Une analyse supplémentaire montre également que notre système réussit à découvrir les caractéristiques importantes du contexte qui déterminent la réponse correcte, indiquant une bonne maîtrise des connaissances basées sur le sens commun.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 7 mois

Reasoning

Apprentissage Profond

LLM

Domaine De Recherche

Approche/Framework

Trieu H. Trinh; Quoc V. Le

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 7 mois

Reasoning

Apprentissage Profond

LLM

Domaine De Recherche

Approche/Framework

Trieu H. Trinh; Quoc V. Le

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Une Méthode Simple pour le Raisonnement de Bon Sens

Trieu H. Trinh; Quoc V. Le

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Une Méthode Simple pour le Raisonnement de Bon Sens

Trieu H. Trinh; Quoc V. Le

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Une Méthode Simple pour le Raisonnement de Bon Sens

Trieu H. Trinh; Quoc V. Le

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters