HyperAIHyperAI

Command Palette

Search for a command to run...

Déploiement En Un Clic De R1-OneVision

Date

il y a 9 mois

Size

380.88 MB

License

Apache 2.0

Paper URL

2503.10615

1. Introduction au tutoriel

R1-OneVision est un modèle de raisonnement multimodal à grande échelle, développé par une équipe de l'Université du Zhejiang et publié en février 2025. Basé sur Qwen2.5-VL et optimisé sur le jeu de données R1-OneVision, ce modèle excelle dans le traitement de tâches complexes de raisonnement visuel, intégrant harmonieusement données visuelles et textuelles. Ses performances sont exceptionnelles en mathématiques, en sciences, en compréhension d'images profondes et en raisonnement logique, et il peut servir d'assistant IA puissant pour résoudre divers problèmes. Des articles de recherche associés sont disponibles. R1-Onevision : Faire progresser le raisonnement multimodal généralisé grâce à la formalisation intermodale .

Ce tutoriel utilise R1-Onevision-7B comme démonstration et la ressource informatique utilise RTX 4090.

2. Étapes de l'opération

1. Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web

Si « Bad Gateway » s'affiche, cela signifie que le modèle est en cours d'initialisation. Veuillez patienter environ 1 à 2 minutes et actualiser la page.

2. Démonstration fonctionnelle

Informations sur la citation

Merci à l'utilisateur de GitHub garçonswu  Pour la réalisation de ce tutoriel, les informations de référence du projet sont les suivantes :

@article{yang2025r1onevision,
  title={R1-Onevision: Advancing Generalized Multimodal Reasoning through Cross-Modal Formalization},
  author={Yi Yang and Xiaoxuan He and Hongkun Pan and Xiyan Jiang and Yan Deng and Xingtao Yang and Haoyu Lu and Dacheng Yin and Fengyun Rao and Minfeng Zhu and Bo Zhang and Wei Chen},
  journal={arXiv preprint arXiv:2503.10615},
  year={2025},
}

Échange et discussion

🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Déploiement En Un Clic De R1-OneVision | Notebooks | HyperAI