HyperAIHyperAI

Command Palette

Search for a command to run...

JetBrains stellt Mixture-of-Experts-Modell Mellum2 vor

JetBrains hat mit Mellum2 ein neues offenes Sprachmodell vorgestellt, das speziell für Aufgaben im Bereich Code und natürlicher Sprache entwickelt wurde. Das Modell mit 12 Milliarden Parametern basiert auf einer Mixture-of-Experts-Architektur und wurde von Grund auf neu trainiert. Ein zentrales Merkmal ist die hohe Effizienz: Pro generiertem Token werden lediglich 2,5 Milliarden Parameter aktiviert. Dies ermöglicht eine schnelle Inferenz mit geringer Latenz, was für Hochdurchsatz-Szenarien entscheidend ist. Mellum2 richtet sich an Anwendungen wie Routing-Systeme, Retrieval-Augmented-Generation-Pipelines, Zusammenfassungen sowie den Betrieb von Sub-Agents. Das Unternehmen betont, dass moderne KI-Systeme zunehmend auf mehrere kleine, spezialisierte Modellaufrufe angewiesen sind, anstatt sich auf einen einzigen großen Monolithen zu verlassen. Viele dieser Operationen, wie etwa die Klassifizierung von Eingaben oder die Werkzeugauswahl, erfordern hohe Geschwindigkeit, sind aber nicht auf die maximale Rechenleistung eines großen Modells angewiesen. Mellum2 fungiert in dieser Architektur als schnelles, fokussiertes Element, das die Gesamtleistung, Kosten und Kontrolle solcher Systeme verbessert. Im Vergleich zu Modellen ähnlicher Größe liefert Mellum2 wettbewerbsfähige Ergebnisse in Benchmark-Tests für Code-Generierung, logisches Denken sowie Wissenschaft und Mathematik. Gleichzeitig ist die Inferenzgeschwindigkeit laut JetBrains um mehr als das Zweifache höher als bei vergleichbaren Alternativen. Diese Effizienz wird durch die Architektur erreicht, bei der das Gesamtvolumen des Modells zwar groß bleibt, aber pro Schritt nur ein Teil der Parameter aktiviert wird. Dadurch sinken die Betriebskosten für Echtzeit-Anwendungen signifikant. Das Modell konzentriert sich ausschließlich auf Text und Code und verzichtet bewusst auf multimodale Fähigkeiten, um kompakt und leistungsfähig für Softwareentwicklungs-Aufgaben zu bleiben. Die Veröffentlichung erfolgt unter der Apache 2.0-Lizenz, was eine freie Nutzung und Anpassung erlaubt. Dies eröffnet insbesondere Unternehmen die Möglichkeit, Mellum2 in privaten, selbst gehosteten Umgebungen einzusetzen, um sensible interne Daten oder proprietären Code sicher zu verarbeiten. JetBrains plant, Mellum2 in verschiedene Bereiche der Softwareentwicklung zu integrieren, einschließlich IDEs, RAG-Pipelines und komplexer Agenten-Workflows. Das Modell ist ab sofort über Hugging Face verfügbar. Details zur Architektur, den Trainingsmethoden und den vollständigen Evaluierungsmethoden werden in einem begleitenden technischen Bericht veröffentlicht. Durch diese Veröffentlichung strebt JetBrains an, Entwicklern eine leistungsfähige und kostengünstige Komponente für den Aufbau effizienter, modulerer KI-Systeme an die Hand zu geben.

Verwandte Links

JetBrains stellt Mixture-of-Experts-Modell Mellum2 vor | Aktuelle Beiträge | HyperAI