HyperAIHyperAI
il y a 2 jours

Intern-S1 : un modèle fondamental multimodal scientifique

Lei Bai, Zhongrui Cai, Maosong Cao, Weihan Cao, Chiyu Chen, Haojiong Chen, Kai Chen, Pengcheng Chen, Ying Chen, Yongkang Chen, Yu Cheng, Yu Cheng, Pei Chu, Tao Chu, Erfei Cui, Ganqu Cui, Long Cui, Ziyun Cui, Nianchen Deng, Ning Ding, Nanqin Dong, Peijie Dong, Shihan Dou, Sinan Du, Haodong Duan, Caihua Fan, Ben Gao, Changjiang Gao, Jianfei Gao, Songyang Gao, Yang Gao, Zhangwei Gao, Jiaye Ge, Qiming Ge, Lixin Gu, Yuzhe Gu, Aijia Guo, Qipeng Guo, Xu Guo, Conghui He, Junjun He, Yili Hong, Siyuan Hou, Caiyu Hu, Hanglei Hu, Jucheng Hu, Ming Hu, Zhouqi Hua, Haian Huang, Junhao Huang, Xu Huang, Zixian Huang, Zhe Jiang, Lingkai Kong, Linyang Li, Peiji Li, Pengze Li, Shuaibin Li, Tianbin Li, Wei Li, Yuqiang Li, Dahua Lin, Junyao Lin, Tianyi Lin, Zhishan Lin, Hongwei Liu, Jiangning Liu, Jiyao Liu, Junnan Liu, Kai Liu, Kaiwen Liu, Kuikun Liu, Shichun Liu, Shudong Liu, Wei Liu, Xinyao Liu, Yuhong Liu, Zhan Liu, Yinquan Lu, Haijun Lv, Hongxia Lv, Huijie Lv, Qidang Lv, Ying Lv, Chengqi Lyu, Chenglong Ma, Jianpeng Ma, Ren Ma, Runmin Ma, Runyuan Ma, Xinzhu Ma, Yichuan Ma, Zihan Ma, Sixuan Mi, Junzhi Ning, Wenchang Ning, Xinle Pang, Jiahui Peng, Runyu Peng, Yu Qiao, Jiantao Qiu, Xiaoye Qu, Yuan Qu, Yuchen Ren, Fukai Shang, Wenqi Shao, Junhao Shen, Shuaike Shen, Chunfeng Song, Demin Song, Diping Song, Chenlin Su, Weijie Su, Weigao Sun, Yu Sun, Qian Tan, Cheng Tang, Huanze Tang, Kexian Tang, Shixiang Tang, Jian Tong, Aoran Wang, Bin Wang, Dong Wang, Lintao Wang, Rui Wang, Weiyun Wang, Wenhai Wang, Yi Wang, Ziyi Wang, Ling-I Wu, Wen Wu, Yue Wu, Zijian Wu, Linchen Xiao, Shuhao Xing, Chao Xu, Huihui Xu, Jun Xu, Ruiliang Xu, Wanghan Xu, GanLin Yang, Yuming Yang, Haochen Ye, Jin Ye, Shenglong Ye, Jia Yu, Jiashuo Yu, Jing Yu, Fei Yuan, Bo Zhang, Chao Zhang, Chen Zhang, Hongjie Zhang, Jin Zhang, Qiaosheng Zhang, Qiuyinzhe Zhang, Songyang Zhang, Taolin Zhang, Wenlong Zhang, Wenwei Zhang, Yechen Zhang, Ziyang Zhang, Haiteng Zhao, Qian Zhao, Xiangyu Zhao, Xiangyu Zhao, Bowen Zhou, Dongzhan Zhou, Peiheng Zhou, Yuhao Zhou, Yunhua Zhou, Dongsheng Zhu, Lin Zhu, Yicheng Zou
Intern-S1 : un modèle fondamental multimodal scientifique
Résumé

Ces dernières années, une grande diversité de modèles fondamentaux open source a émergé, remportant des progrès remarquables dans plusieurs domaines largement suivis, avec des performances s’approchant souvent de celles des modèles propriétaires. Toutefois, dans des domaines scientifiques à haute valeur ajoutée mais plus complexes, soit ces domaines continuent de dépendre de modèles spécialisés, soit l’évolution des modèles fondamentaux généraux reste nettement en retard par rapport à celle observée dans les domaines populaires. Ce retard est insuffisant pour transformer réellement la recherche scientifique, laissant un écart significatif entre les modèles open source et propriétaires dans ces domaines scientifiques. Pour réduire cet écart et avancer davantage vers l’intelligence artificielle générale (AGI), nous introduisons Intern-S1, un modèle généraliste spécialisé doté de capacités générales d’understanding et de raisonnement, ainsi que d’expertise dans l’analyse de données scientifiques multimodales. Intern-S1 est un modèle multimodal à Mélange d’Experts (Mixture-of-Experts, MoE) comportant 28 milliards de paramètres activés et 241 milliards de paramètres au total, pré-entraîné de manière continue sur 5 téra-octets de tokens, dont plus de 2,5 téra-octets provenant de domaines scientifiques. Lors de la phase de post-entraînement, Intern-S1 subit une apprentissage par renforcement (RL) hors ligne, puis en ligne, dans le cadre d’InternBootCamp, où nous proposons le Mélange de Récompenses (Mixture-of-Rewards, MoR), permettant d’optimiser simultanément l’entraînement par renforcement sur plus de 1000 tâches. Grâce à des innovations intégrées dans les algorithmes, les données et les systèmes d’entraînement, Intern-S1 atteint des performances de haut niveau dans l’apprentissage par renforcement en ligne. Sur des benchmarks d’évaluation complets, Intern-S1 démontre des performances compétitives parmi les modèles open source pour les tâches de raisonnement général, et s’impose nettement au-dessus des modèles open source dans les domaines scientifiques, dépassant même certains modèles propriétaires de pointe dans des tâches spécialisées, telles que la planification de synthèse moléculaire, la prédiction des conditions de réaction, ou encore la prévision de la stabilité thermodynamique des cristaux. Nos modèles sont disponibles à l’adresse suivante : https://huggingface.co/internlm/Intern-S1.