HyperAI

Ein-Klick-Bereitstellung Qwen2.5-VL-32B-Instruct

1. Einführung in das Tutorial

Qwen2.5-VL-32B-Instruct ist ein multimodales Großmodell, das vom Alibaba Tongyi Qianwen-Team am 24. März 2025 als Open Source bereitgestellt und unter dem Apache 2.0-Protokoll veröffentlicht wurde. Dieses auf der Qwen2.5-VL-Reihe basierende Modell wird durch Reinforcement-Learning-Technologie optimiert und erzielt mit einer 32B-Parameterskala einen Durchbruch bei den multimodalen Fähigkeiten.

🚀 Schockierendes Upgrade Qwen2.5-VL-32B! Stärkere visuelle KI, intelligenterer multimodaler Assistent! 🌟

🔥 Upgrades der Kernfunktionen

  • Detaillierte visuelle Analyse: In professionellen Bereichen wie der medizinischen Bildanalyse und der Erkennung von technischen Zeichnungen demonstriert das Modell die Fähigkeit zur Inhaltserfassung auf Pixelebene und unterstützt das Assoziationsschlussfolgern mehrerer Graphen sowie die räumlich-zeitliche Dimensionsanalyse.
  • Optimierung des Ausgabestils:Der Ausgabeinhalt des Modells kommt hinsichtlich Formatspezifikationen und Informationsdetails den menschlichen Ausdrucksgewohnheiten näher und kann Lösungen mit klarer Struktur und strenger Logik generieren, insbesondere in komplexen Szenarien.
  • Durchbruch im mathematischen Denken: Bei komplexen mathematischen Problemen, einschließlich Gleichungen mit mehreren Variablen und geometrischen Beweisen, verbessert das Modell die Genauigkeit der Problemlösung durch Algorithmusoptimierung auf das branchenführende Niveau.

Dieses Tutorial verwendet Qwen2.5-VL-32B als Demonstration und die Rechenressourcen betragen A6000*2.

2. Bedienungsschritte

1. Klicken Sie nach dem Starten des Containers auf die API-Adresse, um die Weboberfläche aufzurufen

Wenn „Modell“ nicht angezeigt wird, bedeutet dies, dass das Modell initialisiert wird. Da das Modell groß ist, warten Sie bitte etwa 1–2 Minuten und aktualisieren Sie die Seite.

2. Nachdem Sie die Webseite aufgerufen haben, können Sie ein Gespräch mit dem Modell beginnen

Dieses Tutorial unterstützt die „Online-Suche“. Nachdem diese Funktion aktiviert wurde, verlangsamt sich die Inferenzgeschwindigkeit, was normal ist.

3. Beispiel für einen Schnittstellenaufruf

Dieser Container verwendet standardmäßig Open-WebUI, um den API-Dienst von Qwen2.5-VL-32B aufzurufen. Wenn Sie es lokal verwenden müssen, können Sie sich auf das folgende Aufrufbeispiel beziehen.Enthält Beispiele zur Verwendung von cURL und Python.

Holen Sie sich API_PATH wie gezeigt:


🔹 Aufruf mit cURL

Sie können curl  Der Befehl ruft die API direkt auf:

curl {API_PATH}/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer Empty" \
  -d '{
    "model": "Qwen2.5-VL-32B-Instruct",
    "messages": [
      {
        "role": "user",
        "content": [
          {"type": "text", "text": "请理解图片中的公式,并做详细解释"},
          {"type": "image_url", "image_url": {"url": "https://images2018.cnblogs.com/blog/1203675/201805/1203675-20180525100048863-1610672614.png"}}
        ]
      }
    ],
    "max_tokens": 1024
  }'

🐍 Verwenden von Python zum Aufrufen

Bitte installieren Sie openai  Bibliotheken:

pip install openai

Verwenden Sie dann den folgenden Python-Code:

from openai import OpenAI

client = OpenAI(api_key="Empty", base_url="{API_PATH}/v1/")

response = client.chat.completions.create(
    model="Qwen2.5-VL-32B-Instruct",
    messages = [
        {
        "role": "user",
        "content": [
          {"type": "text", "text": "请理解图片中的公式,并做详细解释"},
          {"type": "image_url", "image_url": {"url": "https://images2018.cnblogs.com/blog/1203675/201805/1203675-20180525100048863-1610672614.png"}}
        ]
      }
    ],
    max_tokens=1000
)
print(response.choices[0].message.content)

Auf diese Weise können Sie die Qwen2.5-VL-32B-API mit der entsprechenden Methode in verschiedenen Umgebungen aufrufen! 🚀

Austausch und Diskussion

🖌️ Wenn Sie ein hochwertiges Projekt sehen, hinterlassen Sie bitte im Hintergrund eine Nachricht, um es weiterzuempfehlen! Darüber hinaus haben wir auch eine Tutorien-Austauschgruppe ins Leben gerufen. Willkommen, Freunde, scannen Sie den QR-Code und kommentieren Sie [SD-Tutorial], um der Gruppe beizutreten, verschiedene technische Probleme zu besprechen und Anwendungsergebnisse auszutauschen ↓