Datum

vor 10 Monaten

Größe

1015.01 MB

1. Einführung in das Tutorial

Qwen2.5-VL-32B-Instruct ist ein multimodales Großmodell, das vom Alibaba Tongyi Qianwen-Team am 24. März 2025 als Open Source bereitgestellt und unter dem Apache 2.0-Protokoll veröffentlicht wurde. Dieses auf der Qwen2.5-VL-Reihe basierende Modell wird durch Reinforcement-Learning-Technologie optimiert und erzielt mit einer 32B-Parameterskala einen Durchbruch bei den multimodalen Fähigkeiten.

🚀 Schockierendes Upgrade Qwen2.5-VL-32B! Stärkere visuelle KI, intelligenterer multimodaler Assistent! 🌟

🔥 Upgrades der Kernfunktionen

Detaillierte visuelle Analyse: In professionellen Bereichen wie der medizinischen Bildanalyse und der Erkennung von technischen Zeichnungen demonstriert das Modell die Fähigkeit zur Inhaltserfassung auf Pixelebene und unterstützt das Assoziationsschlussfolgern mehrerer Graphen sowie die räumlich-zeitliche Dimensionsanalyse.
Optimierung des Ausgabestils：Der Ausgabeinhalt des Modells kommt hinsichtlich Formatspezifikationen und Informationsdetails den menschlichen Ausdrucksgewohnheiten näher und kann Lösungen mit klarer Struktur und strenger Logik generieren, insbesondere in komplexen Szenarien.
Durchbruch im mathematischen Denken: Bei komplexen mathematischen Problemen, einschließlich Gleichungen mit mehreren Variablen und geometrischen Beweisen, verbessert das Modell die Genauigkeit der Problemlösung durch Algorithmusoptimierung auf das branchenführende Niveau.

Dieses Tutorial verwendet Qwen2.5-VL-32B als Demonstration und die Rechenressourcen betragen A6000*2.

2. Bedienungsschritte

1. Klicken Sie nach dem Starten des Containers auf die API-Adresse, um die Weboberfläche aufzurufen

Wenn „Modell“ nicht angezeigt wird, bedeutet dies, dass das Modell initialisiert wird. Da das Modell groß ist, warten Sie bitte etwa 1–2 Minuten und aktualisieren Sie die Seite.

2. Nachdem Sie die Webseite aufgerufen haben, können Sie ein Gespräch mit dem Modell beginnen

Dieses Tutorial unterstützt die „Online-Suche“. Nachdem diese Funktion aktiviert wurde, verlangsamt sich die Inferenzgeschwindigkeit, was normal ist.

3. Beispiel für einen Schnittstellenaufruf

Dieser Container verwendet standardmäßig Open-WebUI, um den API-Dienst von Qwen2.5-VL-32B aufzurufen. Wenn Sie es lokal verwenden müssen, können Sie sich auf das folgende Aufrufbeispiel beziehen.Enthält Beispiele zur Verwendung von cURL und Python.

Holen Sie sich API_PATH wie gezeigt:

🔹 Aufruf mit cURL

Sie können curl Der Befehl ruft die API direkt auf:

curl {API_PATH}/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer Empty" \
  -d '{
    "model": "Qwen2.5-VL-32B-Instruct",
    "messages": [
      {
        "role": "user",
        "content": [
          {"type": "text", "text": "请理解图片中的公式，并做详细解释"},
          {"type": "image_url", "image_url": {"url": "https://images2018.cnblogs.com/blog/1203675/201805/1203675-20180525100048863-1610672614.png"}}
        ]
      }
    ],
    "max_tokens": 1024
  }'

🐍 Verwenden von Python zum Aufrufen

Bitte installieren Sie openai Bibliotheken:

pip install openai

Verwenden Sie dann den folgenden Python-Code:

from openai import OpenAI

client = OpenAI(api_key="Empty", base_url="{API_PATH}/v1/")

response = client.chat.completions.create(
    model="Qwen2.5-VL-32B-Instruct",
    messages = [
        {
        "role": "user",
        "content": [
          {"type": "text", "text": "请理解图片中的公式，并做详细解释"},
          {"type": "image_url", "image_url": {"url": "https://images2018.cnblogs.com/blog/1203675/201805/1203675-20180525100048863-1610672614.png"}}
        ]
      }
    ],
    max_tokens=1000
)
print(response.choices[0].message.content)

Auf diese Weise können Sie die Qwen2.5-VL-32B-API mit der entsprechenden Methode in verschiedenen Umgebungen aufrufen! 🚀

Austausch und Diskussion

🖌️ Wenn Sie ein hochwertiges Projekt sehen, hinterlassen Sie bitte im Hintergrund eine Nachricht, um es weiterzuempfehlen! Darüber hinaus haben wir auch eine Tutorien-Austauschgruppe ins Leben gerufen. Willkommen, Freunde, scannen Sie den QR-Code und kommentieren Sie [SD-Tutorial], um der Gruppe beizutreten, verschiedene technische Probleme zu besprechen und Anwendungsergebnisse auszutauschen ↓

Dieses Notebook wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Bei urheberrechtlichen Bedenken kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Verwandt Notebooks

Bereitstellung Des Medizinischen Argumentationsmodells MedGemma-27b-text-it Mit Einem Klick

vor 3 Monaten

Qwen-Image-Lightning Mit Einem Klick Bereitstellen

vor 2 Monaten

F5-E2 TTS Klont Jeden Ton in Nur 3 Sekunden

vor 2 Monaten

Supertonic: Ein Auf ONNX Basierendes Hochgeschwindigkeits-TTS-Sprachsynthesemodell.

vor 2 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Dieses Notebook ausführen

Datum

vor 10 Monaten

Größe

1015.01 MB

1. Einführung in das Tutorial

🚀 Schockierendes Upgrade Qwen2.5-VL-32B! Stärkere visuelle KI, intelligenterer multimodaler Assistent! 🌟

🔥 Upgrades der Kernfunktionen

Detaillierte visuelle Analyse: In professionellen Bereichen wie der medizinischen Bildanalyse und der Erkennung von technischen Zeichnungen demonstriert das Modell die Fähigkeit zur Inhaltserfassung auf Pixelebene und unterstützt das Assoziationsschlussfolgern mehrerer Graphen sowie die räumlich-zeitliche Dimensionsanalyse.
Optimierung des Ausgabestils：Der Ausgabeinhalt des Modells kommt hinsichtlich Formatspezifikationen und Informationsdetails den menschlichen Ausdrucksgewohnheiten näher und kann Lösungen mit klarer Struktur und strenger Logik generieren, insbesondere in komplexen Szenarien.
Durchbruch im mathematischen Denken: Bei komplexen mathematischen Problemen, einschließlich Gleichungen mit mehreren Variablen und geometrischen Beweisen, verbessert das Modell die Genauigkeit der Problemlösung durch Algorithmusoptimierung auf das branchenführende Niveau.

Dieses Tutorial verwendet Qwen2.5-VL-32B als Demonstration und die Rechenressourcen betragen A6000*2.

2. Bedienungsschritte

1. Klicken Sie nach dem Starten des Containers auf die API-Adresse, um die Weboberfläche aufzurufen

Wenn „Modell“ nicht angezeigt wird, bedeutet dies, dass das Modell initialisiert wird. Da das Modell groß ist, warten Sie bitte etwa 1–2 Minuten und aktualisieren Sie die Seite.

2. Nachdem Sie die Webseite aufgerufen haben, können Sie ein Gespräch mit dem Modell beginnen

Dieses Tutorial unterstützt die „Online-Suche“. Nachdem diese Funktion aktiviert wurde, verlangsamt sich die Inferenzgeschwindigkeit, was normal ist.

3. Beispiel für einen Schnittstellenaufruf

Holen Sie sich API_PATH wie gezeigt:

🔹 Aufruf mit cURL

Sie können curl Der Befehl ruft die API direkt auf:

curl {API_PATH}/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer Empty" \
  -d '{
    "model": "Qwen2.5-VL-32B-Instruct",
    "messages": [
      {
        "role": "user",
        "content": [
          {"type": "text", "text": "请理解图片中的公式，并做详细解释"},
          {"type": "image_url", "image_url": {"url": "https://images2018.cnblogs.com/blog/1203675/201805/1203675-20180525100048863-1610672614.png"}}
        ]
      }
    ],
    "max_tokens": 1024
  }'

🐍 Verwenden von Python zum Aufrufen

Bitte installieren Sie openai Bibliotheken:

pip install openai

Verwenden Sie dann den folgenden Python-Code:

from openai import OpenAI

client = OpenAI(api_key="Empty", base_url="{API_PATH}/v1/")

response = client.chat.completions.create(
    model="Qwen2.5-VL-32B-Instruct",
    messages = [
        {
        "role": "user",
        "content": [
          {"type": "text", "text": "请理解图片中的公式，并做详细解释"},
          {"type": "image_url", "image_url": {"url": "https://images2018.cnblogs.com/blog/1203675/201805/1203675-20180525100048863-1610672614.png"}}
        ]
      }
    ],
    max_tokens=1000
)
print(response.choices[0].message.content)

Auf diese Weise können Sie die Qwen2.5-VL-32B-API mit der entsprechenden Methode in verschiedenen Umgebungen aufrufen! 🚀

Austausch und Diskussion

Verwandt Notebooks

Ein-Klick-Bereitstellung Von Ministry-3-14B-Instruct

vor 2 Monaten

SmolLM3-3B-Modell Mit Einem Klick Bereitstellen

vor 3 Monaten

llama.cpp+openwebui Stellt Qwen3-VL-8B-Instruct-GGUF Bereit

vor 5 Tagen

Open-AutoGLM: Intelligenter Assistent Für Mobile Geräte

vor 2 Monaten

Ein-Klick-Bereitstellung Von DeepSeek-R1-70B

vor 3 Monaten

Bereitstellung Des Medizinischen Argumentationsmodells MedGemma-27b-text-it Mit Einem Klick

vor 3 Monaten

Qwen-Image-Lightning Mit Einem Klick Bereitstellen

vor 2 Monaten

F5-E2 TTS Klont Jeden Ton in Nur 3 Sekunden

vor 2 Monaten

Supertonic: Ein Auf ONNX Basierendes Hochgeschwindigkeits-TTS-Sprachsynthesemodell.

vor 2 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Ein-Klick-Bereitstellung Qwen2.5-VL-32B-Instruct

1. Einführung in das Tutorial

2. Bedienungsschritte

1. Klicken Sie nach dem Starten des Containers auf die API-Adresse, um die Weboberfläche aufzurufen

2. Nachdem Sie die Webseite aufgerufen haben, können Sie ein Gespräch mit dem Modell beginnen

3. Beispiel für einen Schnittstellenaufruf

🔹 Aufruf mit cURL

🐍 Verwenden von Python zum Aufrufen

Austausch und Diskussion

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Ein-Klick-Bereitstellung Qwen2.5-VL-32B-Instruct

1. Einführung in das Tutorial

2. Bedienungsschritte

1. Klicken Sie nach dem Starten des Containers auf die API-Adresse, um die Weboberfläche aufzurufen

2. Nachdem Sie die Webseite aufgerufen haben, können Sie ein Gespräch mit dem Modell beginnen

3. Beispiel für einen Schnittstellenaufruf

🔹 Aufruf mit cURL

🐍 Verwenden von Python zum Aufrufen

Austausch und Diskussion

Verwandt Notebooks

Ein-Klick-Bereitstellung Von Ministry-3-14B-Instruct

SmolLM3-3B-Modell Mit Einem Klick Bereitstellen

llama.cpp+openwebui Stellt Qwen3-VL-8B-Instruct-GGUF Bereit

Open-AutoGLM: Intelligenter Assistent Für Mobile Geräte

Ein-Klick-Bereitstellung Von DeepSeek-R1-70B

Bereitstellung Des Medizinischen Argumentationsmodells MedGemma-27b-text-it Mit Einem Klick

Qwen-Image-Lightning Mit Einem Klick Bereitstellen

F5-E2 TTS Klont Jeden Ton in Nur 3 Sekunden

Supertonic: Ein Auf ONNX Basierendes Hochgeschwindigkeits-TTS-Sprachsynthesemodell.

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Ein-Klick-Bereitstellung Qwen2.5-VL-32B-Instruct

1. Einführung in das Tutorial

2. Bedienungsschritte

1. Klicken Sie nach dem Starten des Containers auf die API-Adresse, um die Weboberfläche aufzurufen

2. Nachdem Sie die Webseite aufgerufen haben, können Sie ein Gespräch mit dem Modell beginnen

3. Beispiel für einen Schnittstellenaufruf

🔹 Aufruf mit cURL

🐍 Verwenden von Python zum Aufrufen

Austausch und Diskussion

Verwandt Notebooks

Ein-Klick-Bereitstellung Von Ministry-3-14B-Instruct

SmolLM3-3B-Modell Mit Einem Klick Bereitstellen

llama.cpp+openwebui Stellt Qwen3-VL-8B-Instruct-GGUF Bereit

Open-AutoGLM: Intelligenter Assistent Für Mobile Geräte

Ein-Klick-Bereitstellung Von DeepSeek-R1-70B

Bereitstellung Des Medizinischen Argumentationsmodells MedGemma-27b-text-it Mit Einem Klick

Qwen-Image-Lightning Mit Einem Klick Bereitstellen

F5-E2 TTS Klont Jeden Ton in Nur 3 Sekunden

Supertonic: Ein Auf ONNX Basierendes Hochgeschwindigkeits-TTS-Sprachsynthesemodell.

KI mit KI entwickeln

HyperAI Newsletters

Verwandt Notebooks

Ein-Klick-Bereitstellung Von Ministry-3-14B-Instruct

SmolLM3-3B-Modell Mit Einem Klick Bereitstellen

llama.cpp+openwebui Stellt Qwen3-VL-8B-Instruct-GGUF Bereit

Open-AutoGLM: Intelligenter Assistent Für Mobile Geräte

Ein-Klick-Bereitstellung Von DeepSeek-R1-70B

Bereitstellung Des Medizinischen Argumentationsmodells MedGemma-27b-text-it Mit Einem Klick

Qwen-Image-Lightning Mit Einem Klick Bereitstellen

F5-E2 TTS Klont Jeden Ton in Nur 3 Sekunden

Supertonic: Ein Auf ONNX Basierendes Hochgeschwindigkeits-TTS-Sprachsynthesemodell.

Verwandt Notebooks

Ein-Klick-Bereitstellung Von Ministry-3-14B-Instruct

SmolLM3-3B-Modell Mit Einem Klick Bereitstellen

llama.cpp+openwebui Stellt Qwen3-VL-8B-Instruct-GGUF Bereit

Open-AutoGLM: Intelligenter Assistent Für Mobile Geräte

Ein-Klick-Bereitstellung Von DeepSeek-R1-70B

Bereitstellung Des Medizinischen Argumentationsmodells MedGemma-27b-text-it Mit Einem Klick

Qwen-Image-Lightning Mit Einem Klick Bereitstellen

F5-E2 TTS Klont Jeden Ton in Nur 3 Sekunden

Supertonic: Ein Auf ONNX Basierendes Hochgeschwindigkeits-TTS-Sprachsynthesemodell.