Einführung in das Tutorial

ChemVLM ist das erste Open-Source-multimodale Sprachmodell im großen Maßstab für den Bereich Chemie, das 2024 vom Shanghai Artificial Intelligence Laboratory eingeführt wurde. Das Modell zielt darauf ab, die Inkompatibilität zwischen dem Verständnis chemischer Bilder und der Textanalyse zu lösen. Durch die Kombination der Vorteile von Visual Transformer (ViT), Multi-Layer Perceptron (MLP) und Large Language Model (LLM) wird eine umfassende Schlussfolgerung aus chemischen Bildern und Texten erreicht. ChemVLM basiert auf der VIT-MLP-LLM-Architektur, übernimmt ChemLLM-20B als grundlegendes Großmodell, verbessert die Fähigkeit des Modells, chemisches Textwissen zu verstehen und zu nutzen, und verwendet InternVIT-6B als Bildcodierer. Darüber hinaus wählte das Forschungsteam sorgfältig hochwertige Daten aus dem Bereich der Chemie aus, darunter Moleküle, Reaktionsformeln und chemische Testdaten, und erstellte einen zweisprachigen multimodalen Frage-Antwort-Datensatz, um die Modellleistung weiter zu verbessern.

Schritte ausführen

1. 克隆并成功启动容器后点击 API 地址即可进入 Web 界面（由于模型较大，成功启动容器后需要等待约 2 分钟才会在 API 地址显示 Web 界面）

2. 可以选择设置相关采样参数（不同的采样参数效果可能不同），然后上传化学图像继续与模型进行对话，例如下图

点击提交即可看到模型输出结果

HyperAI

Dieses Notebook ausführen

Datum

vor einem Jahr

Größe

832.12 MB

ChemVLM: Die Leistungsfähigkeit großer multimodaler Sprachmodelle in der Chemie erkunden

Einführung in das Tutorial

Schritte ausführen

1. 克隆并成功启动容器后点击 API 地址即可进入 Web 界面（由于模型较大，成功启动容器后需要等待约 2 分钟才会在 API 地址显示 Web 界面）

2. 可以选择设置相关采样参数（不同的采样参数效果可能不同），然后上传化学图像继续与模型进行对话，

例如下图

点击提交即可看到模型输出结果

Dieses Notebook wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Bei urheberrechtlichen Bedenken kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Verwandt Notebooks

Bereitstellung Des Medizinischen Argumentationsmodells MedGemma-27b-text-it Mit Einem Klick

vor 3 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Dieses Notebook ausführen

Datum

vor einem Jahr

Größe

832.12 MB

ChemVLM: Die Leistungsfähigkeit großer multimodaler Sprachmodelle in der Chemie erkunden

Einführung in das Tutorial

Schritte ausführen

1. 克隆并成功启动容器后点击 API 地址即可进入 Web 界面（由于模型较大，成功启动容器后需要等待约 2 分钟才会在 API 地址显示 Web 界面）

2. 可以选择设置相关采样参数（不同的采样参数效果可能不同），然后上传化学图像继续与模型进行对话，

例如下图

点击提交即可看到模型输出结果

Verwandt Notebooks

Bereitstellung Des Medizinischen Argumentationsmodells MedGemma-27b-text-it Mit Einem Klick

vor 3 Monaten

SmolLM3-3B-Modell Mit Einem Klick Bereitstellen

vor 2 Monaten

Ein-Klick-Bereitstellung Von DeepSeek-R1-70B

vor 3 Monaten

Ein-Klick-Bereitstellung Von Ministry-3-14B-Instruct

vor 2 Monaten

Qwen-Image-Lightning Mit Einem Klick Bereitstellen

vor 2 Monaten

F5-E2 TTS Klont Jeden Ton in Nur 3 Sekunden

vor 2 Monaten

Ovis-Image: Hochwertiges Bildgenerierungsmodell

vor 2 Monaten

Fara-7B: Ein Hocheffizientes Webbasiertes Intelligentes Agentenmodell

vor 21 Tagen

Docling: Tool Zur Dokumentanalyse

vor 2 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Bereitstellung Von ChemVLM-26B Per Mausklick

ChemVLM: Die Leistungsfähigkeit großer multimodaler Sprachmodelle in der Chemie erkunden

Einführung in das Tutorial

Schritte ausführen

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Bereitstellung Von ChemVLM-26B Per Mausklick

ChemVLM: Die Leistungsfähigkeit großer multimodaler Sprachmodelle in der Chemie erkunden

Einführung in das Tutorial

Schritte ausführen

Verwandt Notebooks

Bereitstellung Des Medizinischen Argumentationsmodells MedGemma-27b-text-it Mit Einem Klick

SmolLM3-3B-Modell Mit Einem Klick Bereitstellen

Ein-Klick-Bereitstellung Von DeepSeek-R1-70B

Ein-Klick-Bereitstellung Von Ministry-3-14B-Instruct

Qwen-Image-Lightning Mit Einem Klick Bereitstellen

F5-E2 TTS Klont Jeden Ton in Nur 3 Sekunden

Ovis-Image: Hochwertiges Bildgenerierungsmodell

Fara-7B: Ein Hocheffizientes Webbasiertes Intelligentes Agentenmodell

Docling: Tool Zur Dokumentanalyse

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Bereitstellung Von ChemVLM-26B Per Mausklick

ChemVLM: Die Leistungsfähigkeit großer multimodaler Sprachmodelle in der Chemie erkunden

Einführung in das Tutorial

Schritte ausführen

Verwandt Notebooks

Bereitstellung Des Medizinischen Argumentationsmodells MedGemma-27b-text-it Mit Einem Klick

SmolLM3-3B-Modell Mit Einem Klick Bereitstellen

Ein-Klick-Bereitstellung Von DeepSeek-R1-70B

Ein-Klick-Bereitstellung Von Ministry-3-14B-Instruct

Qwen-Image-Lightning Mit Einem Klick Bereitstellen

F5-E2 TTS Klont Jeden Ton in Nur 3 Sekunden

Ovis-Image: Hochwertiges Bildgenerierungsmodell

Fara-7B: Ein Hocheffizientes Webbasiertes Intelligentes Agentenmodell

Docling: Tool Zur Dokumentanalyse

KI mit KI entwickeln

HyperAI Newsletters

Verwandt Notebooks

Bereitstellung Des Medizinischen Argumentationsmodells MedGemma-27b-text-it Mit Einem Klick

SmolLM3-3B-Modell Mit Einem Klick Bereitstellen

Ein-Klick-Bereitstellung Von DeepSeek-R1-70B

Ein-Klick-Bereitstellung Von Ministry-3-14B-Instruct

Qwen-Image-Lightning Mit Einem Klick Bereitstellen

F5-E2 TTS Klont Jeden Ton in Nur 3 Sekunden

Ovis-Image: Hochwertiges Bildgenerierungsmodell

Fara-7B: Ein Hocheffizientes Webbasiertes Intelligentes Agentenmodell

Docling: Tool Zur Dokumentanalyse

Verwandt Notebooks

Bereitstellung Des Medizinischen Argumentationsmodells MedGemma-27b-text-it Mit Einem Klick

SmolLM3-3B-Modell Mit Einem Klick Bereitstellen

Ein-Klick-Bereitstellung Von DeepSeek-R1-70B

Ein-Klick-Bereitstellung Von Ministry-3-14B-Instruct

Qwen-Image-Lightning Mit Einem Klick Bereitstellen

F5-E2 TTS Klont Jeden Ton in Nur 3 Sekunden

Ovis-Image: Hochwertiges Bildgenerierungsmodell

Fara-7B: Ein Hocheffizientes Webbasiertes Intelligentes Agentenmodell

Docling: Tool Zur Dokumentanalyse