HyperAIHyperAI
vor einem Monat

EXAONE 4.0: Einheitliche große Sprachmodelle, die nicht-rationale und rationale Modi integrieren

LG AI Research, Kyunghoon Bae, Eunbi Choi, Kibong Choi, Stanley Jungkyu Choi, Yemuk Choi, Kyubeen Han, Seokhee Hong, Junwon Hwang, Taewan Hwang, Joonwon Jang, Hyojin Jeon, Kijeong Jeon, Gerrard Jeongwon Jo, Hyunjik Jo, Jiyeon Jung, Euisoon Kim, Hyosang Kim, Jihoon Kim, Joonkee Kim, Seonghwan Kim, Soyeon Kim, Sunkyoung Kim, Yireun Kim, Yongil Kim, Youchul Kim, Edward Hwayoung Lee, Gwangho Lee, Haeju Lee, Honglak Lee, Jinsik Lee, Kyungmin Lee, Sangha Park, Young Min Paik, Yongmin Park, Youngyong Park, Sanghyun Seo, Sihoon Yang, Heuiyeen Yeen, Sihyuk Yi, Hyeongu Yun
EXAONE 4.0: Einheitliche große Sprachmodelle, die nicht-rationale und rationale Modi integrieren
Abstract

Dieser technische Bericht stellt EXAONE 4.0 vor, das einen Nicht-Schließenden Modus (Non-reasoning mode) und einen Schließenden Modus (Reasoning mode) integriert, um sowohl die ausgezeichnete Benutzerfreundlichkeit von EXAONE 3.5 als auch die fortschrittlichen Schlussfähigkeit von EXAONE Deep zu erreichen. Um den Weg in das Zeitalter der agentischen KI zu ebnen, enthält EXAONE 4.0 wesentliche Funktionen wie die Nutzung agentischer Werkzeuge, und seine mehrsprachigen Fähigkeiten wurden erweitert, um neben Englisch und Koreanisch auch Spanisch zu unterstützen. Die EXAONE 4.0-Modellreihe besteht aus zwei Größen: einem mittelgroßen 32-Billionen-Parameter-Modell (32B model), das für hohe Leistung optimiert ist, und einem kleineren 1,2-Billionen-Parameter-Modell (1.2B model), das für Geräte-integrierte Anwendungen konzipiert wurde. EXAONE 4.0 zeigt eine überlegene Leistung im Vergleich zu offenen Gewichtsmodellen seiner Klasse und bleibt selbst gegenüber modellen der Spitzenklasse wettbewerbsfähig. Die Modelle sind öffentlich für Forschungszwecke verfügbar und können einfach über https://huggingface.co/LGAI-EXAONE heruntergeladen werden.

EXAONE 4.0: Einheitliche große Sprachmodelle, die nicht-rationale und rationale Modi integrieren | Neueste Forschungsarbeiten | HyperAI