HyperAI
Back to Headlines

Qwen3-Coder: Agenter Code-Modell mit neuer Leistung

vor 3 Tagen

Heute geben wir Qwen3-Coder, unser bislang leistungsstärkstes Modell für agentebasiertes Programmieren, bekannt. Qwen3-Coder ist in verschiedenen Größen verfügbar, wobei wir zunächst die mächtigste Variante präsentieren: Qwen3-Coder-480B-A35B-Instruct. Dieses Modell verfügt über 480 Milliarden Parameter und 35 Milliarden aktive Parameter, unterstützt nativ eine Kontextlänge von 256.000 Token und kann durch Extrapolationsmethoden auf 1 Million Token skaliert werden. Es zeichnet sich durch hervorragende Leistungen sowohl im Bereich des Programmierens als auch bei agentebasierten Aufgaben aus. Qwen3-Coder-480B-A35B-Instruct legt neue Maßstäbe unter den offenen Modellen in den Bereichen Agentebasiertes Programmieren, Agentebasierte Webnutzung und Agentebasierte Werkzeugbenutzung, vergleichbar mit Claude Sonnet 4. Neben dem Modell stellen wir auch ein Kommandozeilenwerkzeug für agentebasiertes Programmieren zur Verfügung: Qwen Code. Dieses Werkzeug basiert auf Gemini Code und wurde mit angepassten Prompts und Funktionsaufrufprotokollen erweitert, um die Fähigkeiten von Qwen3-Coder bei agentebasierten Programmieraufgaben vollständig zu entfalten. Qwen3-Coder arbeitet nahtlos mit den besten Entwicklerwerkzeugen der Gemeinschaft zusammen. Als Grundmodell hoffen wir, dass es überall im digitalen Weltgenutztes werden kann – „Agentebasiertes Programmieren in der Welt“! Vortrainierung von Qwen3-Coder Es gibt immer noch Potenzial zur Skalierung in der Vortrainierung, und mit Qwen3-Coder verbessern wir das Modell auf mehreren Ebenen, um seine Kernfähigkeiten zu stärken. Post-Trainierung Skalierung des Code-RL: Schwierig zu lösen, einfach zu überprüfen Im Gegensatz zum üblichen Fokus auf Wettbewerbslevel-Codegenerierung in der Community glauben wir, dass alle Programmieraufgaben naturgemäß gut für ausführungsgetriebene, groß angelegte Reinforcement Learning (RL) geeignet sind. Deshalb haben wir die Code-RL-Trainierung auf eine breitere Palette von realen Programmieraufgaben skaliert. Durch automatisches Skalieren vielfältiger Testfälle erzeugten wir hochwertige Trainingsinstanzen und schlossen erfolgreich das volle Potential des Reinforcement Learnings auf. Dies erhöhte die Erfolgsrate bei Codeausführungen erheblich und brachte auch Verbesserungen bei anderen Aufgaben. Diese Erkenntnis motiviert uns, weiterhin schwierige, aber leicht überprüfbare Aufgaben als fruchtbaren Boden für groß angelegtes Reinforcement Learning zu erforschen. Skalierung des langfristigen RL Bei realen Software-Engineering-Aufgaben wie SWE-Bench muss Qwen3-Coder in mehrstufigen Interaktionen mit der Umgebung agieren, die Planung, Werkzeugbenutzung, Feedbackempfang und Entscheidungsfindung umfassen. Im Post-Trainierungsphase von Qwen3-Coder haben wir langfristiges RL (Agent RL) eingeführt, um das Modell dazu zu ermutigen, reale Aufgaben durch mehrstufige Interaktionen mit Werkzeugen zu lösen. Die Haupt Herausforderung des Agent RL besteht in der Skalierung der Umgebung. Um dies zu bewältigen, bauten wir ein skalierbares System, das in der Lage ist, 20.000 unabhängige Umgebungen parallel auszuführen, unter Verwendung der Infrastruktur von Alibaba Cloud. Diese Infrastruktur liefert die notwendigen Feedbacks für groß angelegtes Reinforcement Learning und unterstützt skalierbare Evaluierungen. Das Ergebnis ist, dass Qwen3-Coder unter den offenen Modellen auf SWE-Bench Verified ohne Testzeit-Skalierung die beste Leistung zeigt. Nutzen von Qwen3-Coder Qwen Code Qwen Code ist ein für Forschungszwecke entwickeltes Kommandozeilenwerkzeug, das von Gemini CLI abgeleitet wurde und durch verbesserte Parser und Werkzeugunterstützung Qwen-Coder-Modelle nutzen kann. Stellen Sie sicher, dass Node.js 20+ installiert ist. Sie können es über die folgenden Befehle installieren: ```bash Node.js 20+ installieren sudo apt-get update sudo apt-get install -y nodejs npm npm install -g n n 20 ``` Dann installieren Sie Qwen Code über den npm-Manager: bash npm install -g qwen-code Alternativ können Sie Qwen Code aus dem Quellcode installieren: bash git clone https://github.com/Qwen-Coder/qwen-code.git cd qwen-code npm install npm link Qwen Code unterstützt den OpenAI SDK bei der Aufrufung von LLMs. Sie können die folgenden Umgebungsvariablen exportieren oder sie einfach in die .env-Datei eintragen. bash export OPENAI_API_KEY=Ihr_Schlüssel export OPENAI_API_BASE=https://dashscope-intl.aliyuncs.com/compatible-mode/v1 Jetzt können Sie Qwen-Code und Qwen genießen, indem Sie einfach qwen eingeben. Claude Code Neben Qwen Code können Sie Qwen3-Coder auch mit Claude Code verwenden. Fordern Sie einfach einen API-Schlüssel auf der Alibaba Cloud Model Studio-Plattform an und installieren Sie Claude Code, um mit dem Programmieren zu beginnen. Wir haben zwei Eintrittspunkte bereitgestellt, um die Nutzung von Qwen3-Coder mit Claude Code nahtlos zu gestalten: Option 1: Claude Code Proxy API Führen Sie nach der Installation den folgenden Befehl aus: bash ccr configure --proxy-api-key Ihr_Schlüssel --proxy-api-base https://dashscope-intl.aliyuncs.com/compatible-mode/v1 Option 2: claude-code-config npm-Paket für Router-Anpassungen Installieren Sie das Paket: bash npm install -g claude-code-config Dann konfigurieren Sie es: bash ccr configure Dieser Befehl generiert automatisch die Konfigurationsdateien und Plugin-Verzeichnisse für ccr. Sie können diese manuell anpassen, indem Sie in die Datei ~/.claude-code-router/config.json und das Verzeichnis ~/.claude-code-router/plugins/ gehen. Starten Sie Claude Code dann über ccr: bash ccr run Cline-Konfiguration Konfigurieren Sie Qwen3-Coder-480B-A35B-Instruct in Cline: Gehen Sie zu den Cline-Konfigurationseinstellungen. Wählen Sie für den API-Provider „OpenAI Compatible“. Geben Sie den von Dashscope erhaltenen OpenAI-Compatible-API-Schlüssel ein. Aktivieren Sie „Use custom base URL“ und geben Sie https://dashscope-intl.aliyuncs.com/compatible-mode/v1 ein. Geben Sie qwen3-coder-plus ein. Anwendungsfälle API Sie können direkt über die Alibaba Cloud Model Studio-Plattform auf die API von Qwen3-Coder zugreifen. Hier ist eine Demonstration, wie Sie dieses Modell mit der Qwen API verwenden können. Zukünftige Arbeit Wir arbeiten aktiv daran, die Leistung unseres Coding Agents weiter zu verbessern, insbesondere dabei, komplexere und mühsamere Aufgaben in der Softwareentwicklung zu bewältigen, um so die menschliche Produktivität zu entlasten. Weitere Größen von Qwen3-Coder sind in Vorbereitung, die starke Leistungen bieten und gleichzeitig die Bereitstellungskosten reduzieren. Zudem erforschen wir intensiv, ob der Coding Agent in der Lage sein kann, sich selbst zu verbessern – eine aufregende und inspirierende Richtung. Bewertung durch Branchenexperten und Firmenprofile Qwen3-Coder hat bereits in der Branche viel Aufmerksamkeit auf sich gezogen. Experten loben die Fähigkeit des Modells, sich nahtlos in bestehende Entwicklerwerkzeuge zu integrieren und komplexe Aufgaben effizient zu lösen. Alibaba Cloud, das Unternehmen hinter Qwen3-Coder, ist bekannt für seine fortschrittliche Cloud-Infrastruktur und ihre Fähigkeit, große Datenmengen zu verarbeiten. Die Einführung von Qwen3-Coder signalisiert einen wichtigen Schritt in Richtung intelligenter, automatisierter Softwareentwicklung, der die Zukunft der Programmierung maßgeblich beeinflussen könnte.

Related Links