HyperAIHyperAI

Command Palette

Search for a command to run...

Das Llama 3 Modellherde

Zusammenfassung

Moderne Künstliche-Intelligenz-Systeme (KI) werden durch Grundmodelle angetrieben.Dieses Papier stellt eine neue Reihe von Grundmodellen vor, die als Llama 3 bezeichnet werden. Es handelt sich um eine Gruppe von Sprachmodellen, die nativ Mehrsprachigkeit, Programmierung, Schlussfolgerung und Werkzeugnutzung unterstützen. Unser größtes Modell ist ein dichter Transformer mit 405 Milliarden Parametern und einem Kontextfenster von bis zu 128.000 Token. Das Papier enthält eine umfangreiche empirische Bewertung von Llama 3. Wir stellen fest, dass Llama 3 auf einer Vielzahl von Aufgaben eine vergleichbare Qualität zu führenden Sprachmodellen wie GPT-4 bietet. Wir veröffentlichen Llama 3 öffentlich, einschließlich vortrainierten und nachtrainierten Versionen des 405-Milliarden-Parameter-Sprachmodells sowie unseres Llama Guard 3-Modells für die Sicherheit von Eingabe und Ausgabe. Das Papier präsentiert zudem die Ergebnisse von Experimenten, in denen wir Fähigkeiten zur Bild-, Video- und Spracherkennung in Llama 3 durch einen kompositionellen Ansatz integrieren. Wir beobachten, dass dieser Ansatz wettbewerbsfähig mit dem Stand der Technik bei Bild-, Video- und Spracherkennungsaufgaben performt. Die resultierenden Modelle werden derzeit noch nicht breit veröffentlicht, da sie sich noch in der Entwicklung befinden.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp