HyperAIHyperAI

Command Palette

Search for a command to run...

英国大语言模型借力NVIDIA Nemotron,赋能本土语言AI应用

英国首个主权人工智能项目“UK-LLM”近日推出基于NVIDIA Nemotron技术的全新AI模型,首次实现对威尔士语的高质量语言推理能力,标志着AI技术在保护和振兴本土语言方面迈出关键一步。该项目由伦敦大学学院主导,联合威尔士班戈大学与NVIDIA共同开发,旨在通过AI赋能威尔士语,推动医疗、教育、法律等公共服务的多语言可及性。 威尔士语作为英国最古老的活语言之一,目前约有85万使用者。该项目的目标是让AI不仅理解英语,也能自然处理威尔士语,帮助实现“2050年实现百万威尔士语使用者”的国家愿景——Cymraeg 2050。英国首相基尔·斯塔默表示,此举确保每个英国人无论使用何种语言,都能平等地享受AI带来的社会福祉。 新模型基于NVIDIA Nemotron开源框架,采用490亿参数的Llama Nemotron Super与90亿参数的Nemotron Nano模型,经过专门的威尔士语数据训练。由于威尔士语语料稀缺,研究团队利用NVIDIA NIM微服务,将超过3000万条英文数据翻译为威尔士语,构建了高质量训练集。整个训练过程依托位于布里斯托尔的英国最强超级计算机Isambard-AI,由政府投资2.25亿英镑支持,采用数百个NVIDIA GH200 Grace Hopper超级芯片加速处理。 班戈大学语言技术中心专家格鲁菲德·普里斯及其团队负责语言准确性验证,特别关注威尔士语中因邻接词变化而产生的音变等复杂语言现象。模型及配套数据集未来将向企业和公共部门开放,支持开发者构建双语聊天机器人、自动翻译系统等应用,助力医疗、教育、零售等领域实现语言公平。 该项目的成功经验将被推广至苏格兰盖尔语、爱尔兰语、康沃尔语等英国其他少数民族语言,并计划与非洲和东南亚国家合作,推动全球少数语言的AI赋能。项目负责人庞图斯·斯泰内托普教授表示,这一模式为全球语言多样性保护提供了可复制的技术路径。 NVIDIA Nemotron模型及其微服务(NIM)已公开,开发者可基于其构建适用于任何语言、领域和场景的AI系统,真正实现“主权AI”与开放创新的结合。

相关链接