HyperAI
Back to Headlines

Cerebras startet Qwen3-235B: Schnellstes KI-Modell mit 131K-Kontext-Support und 10-fach günstiger.

vor 8 Tagen

Cerebras Systems präsentiert Qwen3-235B: Die schnellste Frontier-KI-Modell mit voller 131K Kontextunterstützung PARIS – (BUSINESS WIRE) – Cerebras Systems hat heute das Qwen3-235B-Modell mit voller 131K Kontextunterstützung auf seiner Inferenz-Cloud-Plattform eingeführt. Dieses Meilensteinereignis markiert einen Durchbruch in der KI-Modellleistung, indem es schneidenkantenintelligente Fähigkeiten mit unerreichter Geschwindigkeit kombiniert und dabei die Kosten auf ein Zehntel im Vergleich zu geschlossenen Modellen reduziert. Dies verändert grundlegend die Einführung von KI in Unternehmen. „Mit der Inferenz von Cerebras bekommen Entwickler, die Cline nutzen, einen Vorgeschmack auf die Zukunft. Cline analysiert Probleme, liest Codebasen und schreibt Code in nahezu Echtzeit“, sagte Saoud Rizwan, CEO von Cline. Frontier-Intelligenz auf Cerebras Laut unabhängigen Tests von Artificial Analysis übertrifft Aliababas Qwen3-235B-Modell vordergründige Modelle wie Claude 4 Sonnet, Gemini 2.5 Flash und DeepSeek R1 in verschiedenen Benchmarks für Wissenschaft, Programmierung und allgemeines Wissen. Das Modell verwendet eine effiziente Mixture-of-Experts-Architektur, die eine außergewöhnliche Rechenleistung ermöglicht. Cerebras bietet das Modell zu einem Preis von 0,60 Dollar pro Million Eingabetoken und 1,20 Dollar pro Million Ausgabetoken an – weniger als ein Zehntel des Preises vergleichbarer geschlossener Modelle. Verringern der Rechenzeit von Minuten auf Sekunden Rechenmodelle sind bekannt für ihre langsame Antwortzeit, die oft Minuten dauert, um einfache Fragen zu beantworten. Dank des Wafer Scale Engine-Technologie beschleunigt Cerebras das Qwen3-235B-Modell auf bis zu 1.500 Token pro Sekunde, wodurch die Antwortzeiten von 1-2 Minuten auf 0,6 Sekunden reduziert werden. Dies macht Coding, Rechnen und RAG-Workflows nahezu sofortig. Cerebras ist laut Messungen von Artificial Analysis das einzige Unternehmen weltweit, das ein Frontier-KI-Modell anbietet, das mehr als 1.000 Token pro Sekunde erzeugen kann, was neue Standards für die reale KI-Leistung setzt. 131K Kontext ermöglicht produktionsreife Codegenerierung Parallel zur Einführung hat Cerebras die Kontextlänge von 32K auf 131K Token vervierfacht – die maximale Länge, die Qwen3-235B unterstützt. Diese Erweiterung verbessert direkt die Fähigkeit des Modells, große Codebasen und komplexe Dokumente zu analysieren. Während 32K Kontext für einfache Codegenerierung ausreicht, ermöglicht 131K Kontext das gleichzeitige Verarbeiten von Dutzenden von Dateien und Tausenden von Codezeilen, was produktionsreife Anwendungsentwicklung fördert. Diese erhöhte Kontextlänge bedeutet, dass Cerebras nun den Unternehmensmarkt für Codegenerierung direkt anspricht, einer der größten und schnellsten wachsenden Segmente für generative KI. Strategische Partnerschaft mit Cline Um diese neuen Fähigkeiten zu demonstrieren, hat Cerebras eine Partnerschaft mit Cline eingegangen, dem führenden agentischen Codierungsassistenten für Microsoft VS Code mit über 1,8 Millionen Installationen. Cline-Benutzer können ab sofort Cerebras Qwen-Modelle direkt im Editor nutzen, beginnend mit Qwen3-32B mit 64K Kontext im kostenlosen Tarif. Dies wird erweitert, um Qwen3-235B mit 131K Kontext einzubeziehen, was die Codeschreibgeschwindigkeit um das 10- bis 20-fache im Vergleich zu Alternativen wie DeepSeek R1 steigert. „Mit der Inferenz von Cerebras bekommen Entwickler, die Cline nutzen, einen Vorgeschmack auf die Zukunft. Cline analysiert Probleme, liest Codebasen und schreibt Code in nahezu Echtzeit. Alles geschieht so schnell, dass Entwickler fließen bleiben und in Gedankengeschwindigkeit iterieren können. Eine solche schnelle Inferenz ist nicht nur schön, sondern zeigt uns, was möglich ist, wenn KI tatsächlich mit Entwicklern Schritt hält“, sagte Saoud Rizwan, CEO von Cline. Frontier-Intelligenz 30-mal schneller und zu einem Zehntel der Kosten Durch die heutige Einführung hat Cerebras sein Inferenz-Angebot erheblich erweitert und bietet Entwicklern, die nach einer offenen Alternative zu OpenAI und Anthropic suchen, vergleichbare Intelligenzniveaus und Codegenerierungsfähigkeiten. Cerebras liefert jedoch etwas, das kein anderes KI-Anbieter in der Welt – geschlossen oder offen – bieten kann: eine Instant-Rechen-Geschwindigkeit von über 1.500 Token pro Sekunde, die die Produktivität von Entwicklern im Vergleich zu GPU-Lösungen um ein Vielfaches steigert. All dies wird zu einem Zehntel der Tokenkosten führender geschlossener Modelle angeboten. Über Cerebras Systems Cerebras Systems ist ein Team von vorbildlichen Computerarchitekten, Computerringen, tiefen Lernforschern und Ingenieuren aller Art. Gemeinsam haben sie sich darauf konzentriert, generative KI durch die Entwicklung einer neuen Klasse von KI-Supercomputern zu beschleunigen. Ihr Hauptprodukt, das CS-3 System, wird von der weltweit größten und schnellsten kommerziell erhältlichen KI-Prozessor-Chip, dem Wafer-Scale Engine-3, angetrieben. CS-3-Systeme können einfach und schnell zusammengefasst werden, um die größten KI-Supercomputer der Welt zu bilden, und vereinfachen die Platzierung von Modellen auf diesen Supercomputern, indem sie die Komplexität verteilter Computing vermeiden. Cerebras-Inferenz liefert wegweisende Inferenzgeschwindigkeiten und befähigt Kunden, innovative KI-Anwendungen zu erstellen. Renommierte Unternehmen, Forschungseinrichtungen und Regierungen nutzen Cerebras-Lösungen sowohl für die Entwicklung von proprietären Modellen als auch für die Ausbildung von quelloffenen Modellen mit Millionen von Downloads. Cerebras-Lösungen sind über die Cerebras Cloud und lokal verfügbar. Weitere Informationen finden Sie auf cerebras.ai oder folgen Sie uns auf LinkedIn, X und/oder Threads. Branchenexperten loben die Einführung von Qwen3-235B als revolutionär und sehen darin einen großen Fortschritt in der Einführung von KI in Unternehmen. Die schnelle und kosteneffiziente Leistung des Modells wird als entscheidender Faktor für die Steigerung der Produktivität von Entwicklern angesehen. Cerebras wird weiterhin als innovativer Anbieter in der KI-Branche wahrgenommen, der durch seine einzigartige Technologie und offene Ansätze die Grenzen der KI-Entwicklung erweitert.

Related Links