1. Introduction au tutoriel

Moondream3, proposé par l'équipe Moondream en septembre 2025, est un modèle de langage visuel basé sur une architecture experte hybride, doté de 9 milliards de paramètres (dont 2 milliards de paramètres d'activation). Ce modèle offre des capacités d'inférence visuelle de pointe, prend en charge une longueur de contexte maximale de 32 000 éléments et peut traiter efficacement des images haute résolution. Moondream3 utilise les encodeurs visuels innovants MoE FFN et SigLIP, ce qui le rend adapté à des tâches telles que la réponse à des questions sur des images, l'annotation d'images et la détection d'objets. La littérature technique associée comprend… Aperçu de Moondream 3 : Raisonnement de niveau frontière à une vitesse fulgurante .

Ce tutoriel utilise une seule carte graphique RTX 5090 comme ressource, et la sortie du projet ne prend en charge que l'anglais.

3. Étapes de l'opération

1. Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web

2. Une fois que vous entrez sur la page Web, vous pouvez utiliser le modèle

Si le message « Bad Gateway » s'affiche, cela signifie que le code s'exécute en arrière-plan. Veuillez patienter 2 à 3 minutes, puis actualisez la page.

Comment utiliser

1. Légende

2. Réponses visuelles aux questions

3. Détection d'objets

4. Détection de points

HyperAI

Exécuter ce Notebook Discuter sur Discord

Date

il y a 4 mois

Taille

13.36 MB

Balises

Reconnaissance D'images

Détection D'objets

URL du document

moondream.ai

1. Introduction au tutoriel

Ce tutoriel utilise une seule carte graphique RTX 5090 comme ressource, et la sortie du projet ne prend en charge que l'anglais.

2. Exemples de projets

3. Étapes de l'opération

1. Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web

2. Une fois que vous entrez sur la page Web, vous pouvez utiliser le modèle

Si le message « Bad Gateway » s'affiche, cela signifie que le code s'exécute en arrière-plan. Veuillez patienter 2 à 3 minutes, puis actualisez la page.

Comment utiliser

1. Légende

2. Réponses visuelles aux questions

3. Détection d'objets

4. Détection de points

Ce notebook est fourni par des utilisateurs de la communauté et est destiné à des fins éducatives et informatives uniquement. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour un examen et un retrait rapides.

Associé Notebooks

Depth-Anything-3 : Restauration De L’espace Visuel Depuis N’importe Quelle Perspective

il y a 2 mois

Supertonic : Un Modèle De Synthèse Vocale TTS Haute Vitesse Basé Sur ONNX

il y a 2 mois

Chandra : OCR De Documents De Haute Précision

il y a 2 mois

MOSS : Génération De Dialogues texte-parole

il y a 2 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Exécuter ce Notebook Discuter sur Discord

Date

il y a 4 mois

Taille

13.36 MB

Balises

Reconnaissance D'images

Détection D'objets

URL du document

moondream.ai

1. Introduction au tutoriel

Ce tutoriel utilise une seule carte graphique RTX 5090 comme ressource, et la sortie du projet ne prend en charge que l'anglais.

2. Exemples de projets

3. Étapes de l'opération

1. Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web

2. Une fois que vous entrez sur la page Web, vous pouvez utiliser le modèle

Si le message « Bad Gateway » s'affiche, cela signifie que le code s'exécute en arrière-plan. Veuillez patienter 2 à 3 minutes, puis actualisez la page.

Comment utiliser

1. Légende

2. Réponses visuelles aux questions

3. Détection d'objets

4. Détection de points

Associé Notebooks

JarvisArt - Aperçu Du Proxy De Retouche Photo Intelligent

il y a un mois

Krea-realtime-video : Modèle De Génération Vidéo En Temps Réel

il y a 3 mois

ROCKET-2 : Transfert Zero-Shot Du Jeu 3D

il y a 3 mois

OCRFlux-3B : Boîte À Outils De Reconnaissance De Texte Intelligente

il y a 3 mois

SAM3 : Modèle De Segmentation Visuelle

il y a 2 mois

Depth-Anything-3 : Restauration De L’espace Visuel Depuis N’importe Quelle Perspective

il y a 2 mois

Supertonic : Un Modèle De Synthèse Vocale TTS Haute Vitesse Basé Sur ONNX

il y a 2 mois

Chandra : OCR De Documents De Haute Précision

il y a 2 mois

MOSS : Génération De Dialogues texte-parole

il y a 2 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Aperçu De Moondream3 : Modèle Modulaire De Compréhension Du Langage Visuel

1. Introduction au tutoriel

2. Exemples de projets

3. Étapes de l'opération

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Aperçu De Moondream3 : Modèle Modulaire De Compréhension Du Langage Visuel

1. Introduction au tutoriel

2. Exemples de projets

3. Étapes de l'opération

Associé Notebooks

JarvisArt - Aperçu Du Proxy De Retouche Photo Intelligent

Krea-realtime-video : Modèle De Génération Vidéo En Temps Réel

ROCKET-2 : Transfert Zero-Shot Du Jeu 3D

OCRFlux-3B : Boîte À Outils De Reconnaissance De Texte Intelligente

SAM3 : Modèle De Segmentation Visuelle

Depth-Anything-3 : Restauration De L’espace Visuel Depuis N’importe Quelle Perspective

Supertonic : Un Modèle De Synthèse Vocale TTS Haute Vitesse Basé Sur ONNX

Chandra : OCR De Documents De Haute Précision

MOSS : Génération De Dialogues texte-parole

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Aperçu De Moondream3 : Modèle Modulaire De Compréhension Du Langage Visuel

1. Introduction au tutoriel

2. Exemples de projets

3. Étapes de l'opération

Associé Notebooks

JarvisArt - Aperçu Du Proxy De Retouche Photo Intelligent

Krea-realtime-video : Modèle De Génération Vidéo En Temps Réel

ROCKET-2 : Transfert Zero-Shot Du Jeu 3D

OCRFlux-3B : Boîte À Outils De Reconnaissance De Texte Intelligente

SAM3 : Modèle De Segmentation Visuelle

Depth-Anything-3 : Restauration De L’espace Visuel Depuis N’importe Quelle Perspective

Supertonic : Un Modèle De Synthèse Vocale TTS Haute Vitesse Basé Sur ONNX

Chandra : OCR De Documents De Haute Précision

MOSS : Génération De Dialogues texte-parole

Créer de l'IA avec l'IA

HyperAI Newsletters

Associé Notebooks

JarvisArt - Aperçu Du Proxy De Retouche Photo Intelligent

Krea-realtime-video : Modèle De Génération Vidéo En Temps Réel

ROCKET-2 : Transfert Zero-Shot Du Jeu 3D

OCRFlux-3B : Boîte À Outils De Reconnaissance De Texte Intelligente

SAM3 : Modèle De Segmentation Visuelle

Depth-Anything-3 : Restauration De L’espace Visuel Depuis N’importe Quelle Perspective

Supertonic : Un Modèle De Synthèse Vocale TTS Haute Vitesse Basé Sur ONNX

Chandra : OCR De Documents De Haute Précision

MOSS : Génération De Dialogues texte-parole

Associé Notebooks

JarvisArt - Aperçu Du Proxy De Retouche Photo Intelligent

Krea-realtime-video : Modèle De Génération Vidéo En Temps Réel

ROCKET-2 : Transfert Zero-Shot Du Jeu 3D

OCRFlux-3B : Boîte À Outils De Reconnaissance De Texte Intelligente

SAM3 : Modèle De Segmentation Visuelle

Depth-Anything-3 : Restauration De L’espace Visuel Depuis N’importe Quelle Perspective

Supertonic : Un Modèle De Synthèse Vocale TTS Haute Vitesse Basé Sur ONNX

Chandra : OCR De Documents De Haute Précision

MOSS : Génération De Dialogues texte-parole