1 个月前
EXAONE 4.0:统一的大型语言模型整合非推理和推理模式
LG AI Research, Kyunghoon Bae, Eunbi Choi, Kibong Choi, Stanley Jungkyu Choi, Yemuk Choi, Kyubeen Han, Seokhee Hong, Junwon Hwang, Taewan Hwang, Joonwon Jang, Hyojin Jeon, Kijeong Jeon, Gerrard Jeongwon Jo, Hyunjik Jo, Jiyeon Jung, Euisoon Kim, Hyosang Kim, Jihoon Kim, Joonkee Kim, Seonghwan Kim, Soyeon Kim, Sunkyoung Kim, Yireun Kim, Yongil Kim, Youchul Kim, Edward Hwayoung Lee, Gwangho Lee, Haeju Lee, Honglak Lee, Jinsik Lee, Kyungmin Lee, Sangha Park, Young Min Paik, Yongmin Park, Youngyong Park, Sanghyun Seo, Sihoon Yang, Heuiyeen Yeen, Sihyuk Yi, Hyeongu Yun

摘要
本技术报告介绍了EXAONE 4.0,该版本集成了非推理模式和推理模式,旨在实现EXAONE 3.5的卓越可用性和EXAONE Deep的高级推理能力。为了迎接代理型人工智能时代,EXAONE 4.0引入了代理工具使用等关键功能,并将其多语言能力扩展至支持西班牙语,除了已有的英语和韩语。EXAONE 4.0模型系列包括两种尺寸:一种是优化高性能的中型32B模型,另一种是专为设备端应用设计的小型1.2B模型。与同类开源权重模型相比,EXAONE 4.0表现出色,即使面对前沿类模型也保持竞争力。这些模型已公开供研究使用,并可通过https://huggingface.co/LGAI-EXAONE轻松下载。