HyperAI

Großes Sprachmodell

Großes Sprachmodell (LLM), auch als großes Sprachmodell bekannt, ist ein Algorithmus der künstlichen Intelligenz. Es wendet neuronale Netzwerktechnologie mit einer großen Anzahl von Parametern an und nutzt selbstüberwachte Lerntechniken, um menschliche Sprache oder Texte zu verarbeiten und zu verstehen. Aufgaben wie Textgenerierung, maschinelle Übersetzung, Verfassen von Zusammenfassungen, Bildgenerierung aus Text, maschinelle Kodierung, Chatbots oder Konversations-KI sind allesamt Anwendungen großer Sprachmodelle. Beispiele für solche LLM-Modelle sind Chat GPT von Open AI, BERT (Bidirectional Encoder Representation of Transformer) von Google usw.

LLMs zeichnen sich durch ihren großen Maßstab aus. Milliarden von Parametern helfen ihnen, komplexe Muster in Sprachdaten zu lernen. Diese Modelle basieren häufig auf Deep-Learning-Architekturen wie Transformers, wodurch sie bei verschiedenen NLP-Aufgaben eine beeindruckende Leistung erzielen.

Die folgende Abbildung zeigt den Entwicklungszeitplan großer Sprachmodelle in den letzten Jahren., die gelb hervorgehobenen sind die großen Sprachmodelle, die als Open Source verfügbar sind.

Verweise

https://www.geeksforgeeks.org/large-language-model-llm/?ref=lbp