Microsoft veröffentlicht Mu: Kompaktes Modell für Windows-Assistenten
Microsoft veröffentlicht kleines Modell Mu: Leistungsfähig und für Windows-Assistenten optimiert In den frühen Morgenstunden gab Microsoft bekannt, sein neuestes kleines Modell Mu veröffentlicht zu haben. Mit nur 330 Millionen Parametern kann Mu die Leistung von Microsofts vorherigem Modell Phi-3.5-mini erreichen, das zehnmal mehr Parameter aufweist. Besonders bemerkenswert ist, dass Mu auf Offline-NPU-Geräten eine Geschwindigkeit von über 100 Token pro Sekunde erzielen kann, was in der Welt der kleinen Modelle eine außergewöhnliche Leistung darstellt. Ein Hauptmerkmal von Mu ist die Unterstützung von intelligenten Assistenten in Windows. Benutzer können durch einfache Sprachbefehle Systemvorgänge in Echtzeit durchführen. Zum Beispiel kann ein Befehl wie "Die Mauszeigergröße vergrößern und die Bildschirmhelligkeit anpassen" vom Assistenten präzise erkannt und sofort ausgeführt werden, was die Benutzerfreundlichkeit des Windows-Betriebssystems erheblich verbessert. Die Architektur von Mu: Optimierte Lösung für kleine lokale Bereitstellungen Das Modell Mu basiert auf dem earlier veröffentlichten Phi Silica-Modell und wurde speziell für kleine lokale Bereitstellungen, insbesondere für Copilot+-PCs mit NPU, optimiert. Es verwendet eine nur-decoder-basierte Transformer-Architektur und führt drei wichtige Innovationen ein. Zudem setzt Microsoft fortgeschrittene Trainingsmethoden wie das Vorschaltstabiles Abklingzeitplan und den Muon-Optimierer ein, um die Leistung weiter zu verbessern. Microsoft trainierte Mu auf A100-GPUs, wobei es die Techniken nutzte, die bei der Entwicklung des Phi-Modells erstmals eingeführt wurden. Zunächst erfolgte ein Vortraining auf Hunderten von Milliarden hochwertiger Bildungs-Token, um die Grammatik, Semantik und Welterkenntnisse zu erlernen. Um die Genauigkeit weiter zu erhöhen, erfolgte ein Wissensdistillierungsprozess von Phi-Modellen, was zu einer bemerkenswerten Parameter-Effizienz führte. Obwohl Mu nur ein Zehntel der Parameter von Phi-3.5-mini hat, erreicht es vergleichbare Leistungen. Integration in Windows: Low-Latency und High-Precision in Einklang bringen Um die Benutzerfreundlichkeit des Windows-Betriebssystems zu steigern, arbeitet Microsoft daran, einen AI-Assistenten zu erstellen, der natürliche Sprache verstehen und Systemeinstellungen nahtlos ändern kann. Dieser Assistent soll in die bestehende Suchleiste integriert werden, um eine flüssige Benutzererfahrung zu gewährleisten. Hierfür ist eine extrem niedrige Latenz bei der Verarbeitung vieler möglicher Einstellungen erforderlich. Nach umfangreichen Tests verschiedener Modelle wurde Mu wegen seiner geeigneten Eigenschaften ausgewählt. Obwohl das grundlegende Mu-Modell ohne Feinabstimmung eine Genauigkeitsrate von 50% verzeichnete, gelang es Microsoft, diesen Mangel durch das Erweitern der Trainingsmenge auf 3,6 Millionen Beispiele (eine Steigerung von 1300 Mal) und die Erweiterung der verarbeiteten Einstellungen von etwa 50 auf Hunderte zu kompensieren. Durch die Anwendung automatisierter Annotierungsmethoden, Metadaten-gestützter Prompt-Tuning, diversifizierter Formulierungen, Rauscheinblendung und intelligenter Stichprobenziehung erreichte das für den Assistenten feinabgestimmte Mu-Modell die gewünschten Qualitätsziele. Testergebnisse zeigen, dass der von Mu angetriebene Assistent in der Verständigung und Ausführung von Windows-Einstellungen ausgezeichnet performt und die Reaktionszeit unter 500 Millisekunden hält. Industriefachleute bewerten die Veröffentlichung von Mu sehr positiv. Sie sehen darin einen wichtigen Schritt zur Erreichung von ressourcenschonender künstlicher Intelligenz, die gleichzeitig hohe Leistungen bietet. Microsofts Fokus auf kleine, lokal bereitgestellte Modelle spiegelt die wachsende Bedeutung von Edge-Computing wider, das die Verarbeitung von Daten näher an die Endgeräte bringt und so Latenzzeiten reduziert und Datenschutz verbessert. Das Unternehmen, das seit Jahrzehnten in der Softwareentwicklung führend agiert, setzt damit wieder einmal neue Maßstäbe in der KI-Forschung und -Anwendung.