HyperAI超神经

Grand modèle de langage (LLM), également connu sous le nom de grand modèle de langage, est un algorithme d'intelligence artificielle. Il applique la technologie des réseaux neuronaux avec un grand nombre de paramètres et utilise des techniques d’apprentissage auto-supervisé pour traiter et comprendre le langage ou le texte humain. Des tâches telles que la génération de texte, la traduction automatique, la rédaction de résumés, la génération d'images à partir de texte, l'encodage automatique, les chatbots ou l'IA conversationnelle sont toutes des applications de grands modèles linguistiques. Parmi les exemples de tels modèles LLM, on peut citer Chat GPT d’Open AI, BERT (Bidirectional Encoder Representation of Transformer) de Google, etc.

Les LLM se caractérisent par leur grande échelle, avec des milliards de paramètres les aidant à apprendre des modèles complexes dans les données linguistiques. Ces modèles sont souvent basés sur des architectures d’apprentissage en profondeur telles que Transformers, ce qui les aide à atteindre des performances impressionnantes sur diverses tâches NLP.

La figure suivante montre la chronologie du développement des grands modèles de langage au cours des dernières années., ceux surlignés en jaune sont les grands modèles de langage qui ont été open source.

Références

https://www.geeksforgeeks.org/large-language-model-llm/?ref=lbp

Grand Modèle De Langage

Références