HyperAIHyperAI

Command Palette

Search for a command to run...

UK-LLM: KI für walisisch mit NVIDIA Nemotron

Die UK-LLM-Initiative, eine von University College London geführte Forschungskooperation, hat gemeinsam mit NVIDIA und der Universität Bangor einen neuen KI-Modell für die walisische Sprache entwickelt, der auf der NVIDIA Nemotron-Plattform basiert. Ziel ist es, hochwertiges künstliches Denken in walisisch zu ermöglichen, um öffentliche Dienstleistungen wie Gesundheitsversorgung, Bildung und Rechtsressourcen in der Sprache der etwa 850.000 walisischen MuttersprachlerInnen bereitzustellen. Der Modellentwicklungsprozess nutzte die offenen Gewichte und Datensätze von NVIDIA Nemotron, insbesondere die 49-Milliarden-Parameter-Llama-Nemotron-Super- und die 9-Milliarden-Parameter-Nemotron-Nano-Modelle, die auf walisischen Texten nachtrainiert wurden. Aufgrund der begrenzten Verfügbarkeit an walisischen Trainingsdaten setzte das Team NVIDIA NIM-Mikroservices ein, um über 30 Millionen Einträge aus englischen Open-Source-Daten mit Modellen wie gpt-oss-120b und DeepSeek-R1 in walisisch zu übersetzen. Die Rechenleistung wurde über das NVIDIA DGX Cloud Lepton-Platform und den Isambard-AI-Supercomputer in Bristol bereitgestellt, der mit 225 Millionen Pfund staatlich finanziert wurde. Die Universität Bangor, spezialisiert auf walisische Sprachtechnologie, sorgt für linguistische Genauigkeit und kulturelle Sensibilität, insbesondere bei der Behandlung komplexer Phonologie- und Grammatikregeln, die KI-Systeme oft überfordern. Das Modell und die dazugehörigen Datensätze sollen für öffentliche und private Entwickler über die Plattform von Nscale über eine API zugänglich sein. Der Erfolg soll als Modell für die Entwicklung von KI-Modellen für andere britische Minderheitensprachen wie Cornish, Irisch, Schottisch und Gälisch dienen – ebenso wie für internationale Sprachen aus Afrika und Südostasien. UK-Prime Minister Keir Starmer betonte, dass dies ein Beispiel für „sovereigne KI“ sei, die kulturelle Identität schützt und den Zugang zu Technologie für alle BürgerInnen gewährleistet. Industrieexperten sehen in der Initiative eine bahnbrechende Entwicklung für die digitale Inklusion von Minderheitensprachen. Die Kombination aus offenen KI-Modellen, nationaler Recheninfrastruktur und interdisziplinärer Zusammenarbeit zeigt, wie öffentliche Forschung und private Technologiepartner gemeinsam kulturelle Erhaltung und technologische Fortschritte verbinden können. NVIDIA Nemotron und NIM-Mikroservices ermöglichen kosteneffiziente, skalierbare und transparente KI-Entwicklung, die auch in Europa zunehmend nachgefragt wird. Die Initiative unterstreicht, dass KI nicht nur für dominante Sprachen wie Englisch oder Spanisch entwickelt werden sollte, sondern dass digitale Gerechtigkeit durch Sprachdiversität gefördert werden kann. Mit dem Ziel, bis 2050 eine Million walisischer SprecherInnen zu erreichen (Cymraeg 2050), wird die Technologie nicht nur als Werkzeug, sondern als kultureller Aktionsplan verstanden. Die Offenlegung von Modellen und Datensätzen ist entscheidend, um Nachahmung, Weiterentwicklung und breite Nutzung zu ermöglichen – ein entscheidender Unterschied zwischen bloßer Technologie und echter gesellschaftlicher Wirkung.

Verwandte Links

UK-LLM: KI für walisisch mit NVIDIA Nemotron | Aktuelle Beiträge | HyperAI