Introduction au tutoriel

ChemVLM est le premier modèle de langage multimodal open source à grande échelle pour le domaine de la chimie lancé par le Laboratoire d'intelligence artificielle de Shanghai en 2024. Le modèle vise à résoudre l'incompatibilité entre la compréhension des images chimiques et l'analyse de texte. En combinant les avantages du Visual Transformer (ViT), du Multi-layer Perceptron (MLP) et du Large Language Model (LLM), il permet un raisonnement complet des images chimiques et du texte. ChemVLM est basé sur l'architecture VIT-MLP-LLM, adopte ChemLLM-20B comme modèle de base à grande échelle, améliore la capacité du modèle à comprendre et à utiliser les connaissances textuelles chimiques et utilise InternVIT-6B comme encodeur d'image. De plus, l’équipe de recherche a soigneusement sélectionné des données de haute qualité, notamment des molécules, des formules de réaction et des données de tests chimiques dans le domaine de la chimie, et a construit un ensemble de données de questions-réponses multimodales bilingues pour améliorer encore les performances du modèle.

Étapes de course

1. 克隆并成功启动容器后点击 API 地址即可进入 Web 界面（由于模型较大，成功启动容器后需要等待约 2 分钟才会在 API 地址显示 Web 界面）

2. 可以选择设置相关采样参数（不同的采样参数效果可能不同），然后上传化学图像继续与模型进行对话，例如下图

点击提交即可看到模型输出结果

HyperAI

Exécuter ce Notebook Discuter sur Discord

Date

il y a un an

Taille

832.12 MB

Balises

IA Pour La Science

ChemVLM : Explorer la puissance des grands modèles de langage multimodaux en chimie

Introduction au tutoriel

Étapes de course

1. 克隆并成功启动容器后点击 API 地址即可进入 Web 界面（由于模型较大，成功启动容器后需要等待约 2 分钟才会在 API 地址显示 Web 界面）

2. 可以选择设置相关采样参数（不同的采样参数效果可能不同），然后上传化学图像继续与模型进行对话，

例如下图

点击提交即可看到模型输出结果

Ce notebook est fourni par des utilisateurs de la communauté et est destiné à des fins éducatives et informatives uniquement. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour un examen et un retrait rapides.

Associé Notebooks

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Exécuter ce Notebook Discuter sur Discord

Date

il y a un an

Taille

832.12 MB

Balises

IA Pour La Science

ChemVLM : Explorer la puissance des grands modèles de langage multimodaux en chimie

Introduction au tutoriel

Étapes de course

1. 克隆并成功启动容器后点击 API 地址即可进入 Web 界面（由于模型较大，成功启动容器后需要等待约 2 分钟才会在 API 地址显示 Web 界面）

2. 可以选择设置相关采样参数（不同的采样参数效果可能不同），然后上传化学图像继续与模型进行对话，

例如下图

点击提交即可看到模型输出结果

Associé Notebooks

Déploiement En Un Clic Du Modèle De Raisonnement Médical MedGemma-27b-text-it

il y a 3 mois

Déploiement En Un Clic Du Modèle SmolLM3-3B

il y a 3 mois

Déploiement En Un Clic De DeepSeek-R1-70B

il y a 3 mois

Déploiement En Un Clic De l'instruction Ministry-3-14B-Instruct

il y a 2 mois

Déploiement En Un Clic De Qwen-Image-Lightning

il y a 2 mois

F5-E2 TTS Clone n'importe Quel Son En Seulement 3 Secondes

il y a 2 mois

Ovis-Image : Modèle De Génération d'images De Haute Qualité

il y a 2 mois

Fara-7B : Un Modèle D’agent Intelligent Web Hautement Efficace

il y a 21 jours

Doling : Outil d'analyse De Documents

il y a 2 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Déploiement En Un Clic De ChemVLM-26B

ChemVLM : Explorer la puissance des grands modèles de langage multimodaux en chimie

Introduction au tutoriel

Étapes de course

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Déploiement En Un Clic De ChemVLM-26B

ChemVLM : Explorer la puissance des grands modèles de langage multimodaux en chimie

Introduction au tutoriel

Étapes de course

Associé Notebooks

Déploiement En Un Clic Du Modèle De Raisonnement Médical MedGemma-27b-text-it

Déploiement En Un Clic Du Modèle SmolLM3-3B

Déploiement En Un Clic De DeepSeek-R1-70B

Déploiement En Un Clic De l'instruction Ministry-3-14B-Instruct

Déploiement En Un Clic De Qwen-Image-Lightning

F5-E2 TTS Clone n'importe Quel Son En Seulement 3 Secondes

Ovis-Image : Modèle De Génération d'images De Haute Qualité

Fara-7B : Un Modèle D’agent Intelligent Web Hautement Efficace

Doling : Outil d'analyse De Documents

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Déploiement En Un Clic De ChemVLM-26B

ChemVLM : Explorer la puissance des grands modèles de langage multimodaux en chimie

Introduction au tutoriel

Étapes de course

Associé Notebooks

Déploiement En Un Clic Du Modèle De Raisonnement Médical MedGemma-27b-text-it

Déploiement En Un Clic Du Modèle SmolLM3-3B

Déploiement En Un Clic De DeepSeek-R1-70B

Déploiement En Un Clic De l'instruction Ministry-3-14B-Instruct

Déploiement En Un Clic De Qwen-Image-Lightning

F5-E2 TTS Clone n'importe Quel Son En Seulement 3 Secondes

Ovis-Image : Modèle De Génération d'images De Haute Qualité

Fara-7B : Un Modèle D’agent Intelligent Web Hautement Efficace

Doling : Outil d'analyse De Documents

Créer de l'IA avec l'IA

HyperAI Newsletters

Associé Notebooks

Déploiement En Un Clic Du Modèle De Raisonnement Médical MedGemma-27b-text-it

Déploiement En Un Clic Du Modèle SmolLM3-3B

Déploiement En Un Clic De DeepSeek-R1-70B

Déploiement En Un Clic De l'instruction Ministry-3-14B-Instruct

Déploiement En Un Clic De Qwen-Image-Lightning

F5-E2 TTS Clone n'importe Quel Son En Seulement 3 Secondes

Ovis-Image : Modèle De Génération d'images De Haute Qualité

Fara-7B : Un Modèle D’agent Intelligent Web Hautement Efficace

Doling : Outil d'analyse De Documents

Associé Notebooks

Déploiement En Un Clic Du Modèle De Raisonnement Médical MedGemma-27b-text-it

Déploiement En Un Clic Du Modèle SmolLM3-3B

Déploiement En Un Clic De DeepSeek-R1-70B

Déploiement En Un Clic De l'instruction Ministry-3-14B-Instruct

Déploiement En Un Clic De Qwen-Image-Lightning

F5-E2 TTS Clone n'importe Quel Son En Seulement 3 Secondes

Ovis-Image : Modèle De Génération d'images De Haute Qualité

Fara-7B : Un Modèle D’agent Intelligent Web Hautement Efficace

Doling : Outil d'analyse De Documents