HyperAIHyperAI

Command Palette

Search for a command to run...

Qwen Technischer Bericht

Zusammenfassung

Große Sprachmodelle (LLMs) haben das Feld der künstlichen Intelligenz revolutioniert und natürliche Sprachverarbeitungsaufgaben ermöglicht, die bisher ausschließlich menschlichen Fähigkeiten zugeschrieben wurden. In dieser Arbeit stellen wir Qwen vor, den ersten Teil unserer Serie großer Sprachmodelle. Qwen ist eine umfassende Serie von Sprachmodellen, die unterschiedliche Modelle mit variierenden Parameteranzahlen umfasst. Sie umfasst Qwen, die Basis-Prätrainierten Sprachmodelle, sowie Qwen-Chat, die durch menschliche Ausrichtungstechniken fine-tuneten Chat-Modelle. Die Basis-Sprachmodelle zeigen konsistent herausragende Leistung in einer Vielzahl von Downstream-Aufgaben, während die Chat-Modelle – insbesondere jene, die mit Reinforcement Learning aus menschlichem Feedback (RLHF) trainiert wurden – äußerst wettbewerbsfähig sind. Die Chat-Modelle verfügen über fortgeschrittene Fähigkeiten im Umgang mit Werkzeugen und Planung, die zur Entwicklung von Agentenanwendungen genutzt werden können, und zeigen beeindruckende Leistung, selbst wenn sie größeren Modellen bei komplexen Aufgaben wie der Nutzung eines Code-Interpreters gegenüberstehen. Darüber hinaus haben wir spezialisierte Programmiermodelle, Code-Qwen und Code-Qwen-Chat, sowie mathematikorientierte Modelle, Math-Qwen-Chat, entwickelt, die auf den Basis-Sprachmodellen aufbauen. Diese Modelle erreichen im Vergleich zu Open-Source-Modellen signifikant verbesserte Leistung und liegen lediglich leicht hinter proprietären Modellen zurück.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp