HyperAIHyperAI

Command Palette

Search for a command to run...

Bereitstellung Von Qwen3-4B-2507 Mit Einem Klick

Date

vor 5 Monaten

Size

1.72 MB

Tags

License

Apache 2.0

Paper URL

2505.09388

1. Einführung in das Tutorial

GitHub Stars

Qwen3-4B-Thinking-2507 und Qwen3-4B-Instruct-2507 sind große Sprachmodelle, die im August 2025 vom Tongyi-Qianwen-Team von Alibaba veröffentlicht wurden. Qwen3-4B-Thinking-2507 übertrifft kleinere Qwen3-Modelle ähnlicher Größe deutlich in Bezug auf komplexes Problemlösen, mathematische Fähigkeiten, Programmierfähigkeiten und die Fähigkeit zu mehrstufigen Funktionsaufrufen. Im Bereich des nicht-logischen Denkens übertrifft Qwen3-4B-Instruct-2507 das proprietäre, kleine Modell GPT-4.1-nano in Bezug auf Wissen, logisches Denken, Programmierung, Alignment und Handlungsfähigkeit umfassend und erreicht eine Leistung, die der des mittelgroßen Modells Qwen3-30B-A3B (nicht-logisch) nahekommt. Dieses Modell deckt ein breiteres Spektrum an sprachlichem Wissen ab, verbessert das Alignment gegenüber menschlichen Präferenzen bei subjektiven und offenen Aufgaben und liefert relevantere Antworten. Ergebnisse verwandter Publikationen sind… Qwen3 Technischer Bericht .

Dieses Tutorial verwendet Dual-Card-RTX-4090-Ressourcen.

2. Projektbeispiele

Qwen3-4B-Denken-2507 

Qwen3-4B-Anweisung-2507 

3. Bedienungsschritte

1. Klicken Sie nach dem Starten des Containers auf die API-Adresse, um die Weboberfläche aufzurufen

2. Nachdem Sie die Webseite aufgerufen haben, können Sie ein Gespräch mit dem Modell beginnen

Wenn „Modell“ nicht angezeigt wird, bedeutet dies, dass das Modell initialisiert wird. Da das Modell groß ist, warten Sie bitte etwa 2-3 Minuten und aktualisieren Sie die Seite.

Anwendung

Qwen3-4B-Denken-2507

Qwen3-4B-Anweisung-2507

4. Diskussion

🖌️ Wenn Sie ein hochwertiges Projekt sehen, hinterlassen Sie bitte im Hintergrund eine Nachricht, um es weiterzuempfehlen! Darüber hinaus haben wir auch eine Tutorien-Austauschgruppe ins Leben gerufen. Willkommen, Freunde, scannen Sie den QR-Code und kommentieren Sie [SD-Tutorial], um der Gruppe beizutreten, verschiedene technische Probleme zu besprechen und Anwendungsergebnisse auszutauschen ↓

Zitationsinformationen

Die Zitationsinformationen für dieses Projekt lauten wie folgt:

@misc{qwen3technicalreport,
      title={Qwen3 Technical Report}, 
      author={Qwen Team},
      year={2025},
      eprint={2505.09388},
      archivePrefix={arXiv},
      primaryClass={cs.CL},
      url={https://arxiv.org/abs/2505.09388}, 
}

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp