HyperAI

Stellen Sie Gemma-3-27B-IT Mit vLLM Bereit

1. Einführung in das Tutorial

Gemma-3-27B-IT ist das Gemma-Großmodell der dritten Generation, das 2025 von Google als Open Source freigegeben wurde, eine anweisungsoptimierte Version mit 27 Milliarden Parametern.

Die Gemma-Serie ist eine Reihe großer, von Google als Open Source bereitgestellter Modelle, die auf derselben Forschung und Technologie basieren wie das Gemini-Modell. Gemma 3 ist ein großes multimodales Modell, das Text- und Bildeingaben verarbeiten und Textausgaben generieren kann, wobei offene Gewichte sowohl in vortrainierten als auch in anweisungsoptimierten Varianten verfügbar sind. Das Modell verfügt über ein 128K-Kontextfenster, unterstützt über 140 Sprachen und bietet mehr Modellgrößen als frühere Versionen. Gemma 3-Modelle eignen sich für eine Vielzahl von Aufgaben zur Textgenerierung und zum Bildverständnis, einschließlich der Beantwortung von Fragen, Zusammenfassungen und Schlussfolgerungen. Aufgrund ihrer relativ geringen Größe können sie in Umgebungen mit begrenzten Ressourcen eingesetzt werden, beispielsweise auf Laptops, Desktops oder in Cloud-Infrastrukturen.

Dieses Tutorial verwendet gemma-3-27b-it als Demonstration und die Rechenressource verwendet eine einzelne Karte A6000.

2. Bedienungsschritte

1. Klicken Sie nach dem Starten des Containers auf die API-Adresse, um die Weboberfläche aufzurufen. Aufgrund des großen Modells dauert es etwa 3 Minuten, bis die WebUI-Oberfläche angezeigt wird, andernfalls wird „Bad Gateway“ angezeigt.

2. Nach dem Aufrufen der Webseite können Sie eine Modellinferenz durchführen

  1. Textkonversation: Geben Sie Text direkt ein und führen Sie eine Textkonversation, ohne Fotos hochzuladen
  2. Bildverständnis: Geben Sie Text und Bilder ein, um ein entsprechendes Modellverständnis zu generieren

* Führen Sie das Beispiel aus

Austausch und Diskussion

🖌️ Wenn Sie ein hochwertiges Projekt sehen, hinterlassen Sie bitte im Hintergrund eine Nachricht, um es weiterzuempfehlen! Darüber hinaus haben wir auch eine Tutorien-Austauschgruppe ins Leben gerufen. Willkommen, Freunde, scannen Sie den QR-Code und kommentieren Sie [SD-Tutorial], um der Gruppe beizutreten, verschiedene technische Probleme zu besprechen und Anwendungsergebnisse auszutauschen ↓