1. Einführung in das Tutorial

Moondream3, im September 2025 vom Moondream-Team vorgestellt, ist ein visuelles Sprachmodell, das auf einer hybriden Expertenarchitektur basiert und über 9 Milliarden Parameter verfügt (davon 2 Milliarden Aktivierungsparameter). Dieses Modell bietet modernste visuelle Inferenzfunktionen, unterstützt eine maximale Kontextlänge von 32.000 und kann hochauflösende Bilder effizient verarbeiten. Moondream3 verwendet die innovativen visuellen Encoder MoE FFN und SigLIP und eignet sich daher für Aufgaben wie Bild-Fragen-Beantwortung, Bildannotation und Objekterkennung. Weiterführende Fachliteratur finden Sie unter … Moondream 3-Vorschau: Grenzüberschreitendes Denken in atemberaubender Geschwindigkeit .

Dieses Tutorial verwendet eine einzelne RTX 5090 Grafikkarte als Ressource, und die Projektausgabe unterstützt nur Englisch.

3. Bedienungsschritte

1. Klicken Sie nach dem Starten des Containers auf die API-Adresse, um die Weboberfläche aufzurufen

2. Sobald Sie die Webseite betreten, können Sie das Modell verwenden

Wenn „Bad Gateway“ angezeigt wird, bedeutet dies, dass der Code im Hintergrund ausgeführt wird. Bitte warten Sie etwa 2-3 Minuten und aktualisieren Sie die Seite.

Anwendung

1. Bildunterschrift

2. Visuelle Fragenbeantwortung

3. Objekterkennung

4. Punkterkennung

HyperAI

Dieses Notebook ausführen Auf Discord diskutieren

Datum

vor 4 Monaten

Größe

13.36 MB

1. Einführung in das Tutorial

Dieses Tutorial verwendet eine einzelne RTX 5090 Grafikkarte als Ressource, und die Projektausgabe unterstützt nur Englisch.

2. Projektbeispiele

3. Bedienungsschritte

1. Klicken Sie nach dem Starten des Containers auf die API-Adresse, um die Weboberfläche aufzurufen

2. Sobald Sie die Webseite betreten, können Sie das Modell verwenden

Wenn „Bad Gateway“ angezeigt wird, bedeutet dies, dass der Code im Hintergrund ausgeführt wird. Bitte warten Sie etwa 2-3 Minuten und aktualisieren Sie die Seite.

Anwendung

1. Bildunterschrift

2. Visuelle Fragenbeantwortung

3. Objekterkennung

4. Punkterkennung

Dieses Notebook wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Bei urheberrechtlichen Bedenken kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Verwandt Notebooks

Supertonic: Ein Auf ONNX Basierendes Hochgeschwindigkeits-TTS-Sprachsynthesemodell.

vor 2 Monaten

Chandra: Hochpräzise Dokumenten-OCR

vor 2 Monaten

MOSS: Text-to-Spoken-Dialoggenerierung

vor 2 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Dieses Notebook ausführen Auf Discord diskutieren

Datum

vor 4 Monaten

Größe

13.36 MB

1. Einführung in das Tutorial

Dieses Tutorial verwendet eine einzelne RTX 5090 Grafikkarte als Ressource, und die Projektausgabe unterstützt nur Englisch.

2. Projektbeispiele

3. Bedienungsschritte

1. Klicken Sie nach dem Starten des Containers auf die API-Adresse, um die Weboberfläche aufzurufen

2. Sobald Sie die Webseite betreten, können Sie das Modell verwenden

Wenn „Bad Gateway“ angezeigt wird, bedeutet dies, dass der Code im Hintergrund ausgeführt wird. Bitte warten Sie etwa 2-3 Minuten und aktualisieren Sie die Seite.

Anwendung

1. Bildunterschrift

2. Visuelle Fragenbeantwortung

3. Objekterkennung

4. Punkterkennung