チュートリアルの紹介

ChemVLM は、上海人工知能研究所が 2024 年に開始した化学分野初のオープンソースマルチモーダル大規模言語モデルです。このモデルは、ビジュアルトランスフォーマー (ViT)、多層パーセプトロン (MLP)、および大規模言語モデル (LLM) の利点を組み合わせることにより、化学画像の理解とテキスト分析の間の非互換性の問題を解決することを目的としています。総合的な推論。 ChemVLM は VIT-MLP-LLM アーキテクチャに基づいており、基本的な大規模モデルとして ChemLLM-20B を使用し、化学テキストの知識を理解して利用するモデルの能力を強化し、画像エンコーダーとして InternVIT-6B を使用します。さらに、研究チームは、分子、反応式、化学試験データなど、化学分野から高品質のデータを慎重に選択し、モデルのパフォーマンスをさらに向上させるために、バイリンガルのマルチモーダルな質問と回答のデータセットを構築しました。

ステップの実行

1. 克隆并成功启动容器后点击 API 地址即可进入 Web 界面（由于模型较大，成功启动容器后需要等待约 2 分钟才会在 API 地址显示 Web 界面）

2. 可以选择设置相关采样参数（不同的采样参数效果可能不同），然后上传化学图像继续与模型进行对话，例如下图

点击提交即可看到模型输出结果

HyperAI

このNotebookを実行 Discordで議論

日付

1年前

サイズ

832.12 MB

タグ

サイエンスのためのAI

ChemVLM: 化学におけるマルチモーダル大規模言語モデルの力の探求

チュートリアルの紹介

ステップの実行

1. 克隆并成功启动容器后点击 API 地址即可进入 Web 界面（由于模型较大，成功启动容器后需要等待约 2 分钟才会在 API 地址显示 Web 界面）

2. 可以选择设置相关采样参数（不同的采样参数效果可能不同），然后上传化学图像继续与模型进行对话，

例如下图

点击提交即可看到模型输出结果

このノートブックはコミュニティユーザーによって提供されたものであり、教育および情報提供のみを目的としています。コンテンツに著作権侵害が含まれる場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

このNotebookを実行 Discordで議論

日付

1年前

サイズ

832.12 MB

タグ

サイエンスのためのAI

ChemVLM: 化学におけるマルチモーダル大規模言語モデルの力の探求

チュートリアルの紹介

ステップの実行

1. 克隆并成功启动容器后点击 API 地址即可进入 Web 界面（由于模型较大，成功启动容器后需要等待约 2 分钟才会在 API 地址显示 Web 界面）

2. 可以选择设置相关采样参数（不同的采样参数效果可能不同），然后上传化学图像继续与模型进行对话，

例如下图

点击提交即可看到模型输出结果

MedGemma-27b-text-it医療推論モデルのワンクリック展開

3ヶ月前

SmolLM3-3Bモデルのワンクリック展開

2ヶ月前

DeepSeek-R1-70Bのワンクリック展開

3ヶ月前

Yolov13のワンクリック展開

3ヶ月前

Ministry-3-14B-Instructのワンクリック展開

2ヶ月前

Qwen-Image-Lightningのワンクリック展開

2ヶ月前

F5-E2 TTS あらゆるサウンドをわずか 3 秒でクローン作成

2ヶ月前

Ovis-Image: 高品質画像生成モデル

2ヶ月前

Fara-7B: 非常に効率的なWebベースのインテリジェントエージェントモデル

18日前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Command Palette

ワンクリックで ChemVLM-26B を導入

ChemVLM: 化学におけるマルチモーダル大規模言語モデルの力の探求

チュートリアルの紹介

ステップの実行

AIでAIを構築

HyperAI Newsletters

Command Palette

ワンクリックで ChemVLM-26B を導入

ChemVLM: 化学におけるマルチモーダル大規模言語モデルの力の探求

チュートリアルの紹介

ステップの実行

関連 ノートブック

MedGemma-27b-text-it医療推論モデルのワンクリック展開

SmolLM3-3Bモデルのワンクリック展開

DeepSeek-R1-70Bのワンクリック展開

Yolov13のワンクリック展開

Ministry-3-14B-Instructのワンクリック展開

Qwen-Image-Lightningのワンクリック展開

F5-E2 TTS あらゆるサウンドをわずか 3 秒でクローン作成

Ovis-Image: 高品質画像生成モデル

Fara-7B: 非常に効率的なWebベースのインテリジェントエージェントモデル

AIでAIを構築

HyperAI Newsletters

Command Palette

ワンクリックで ChemVLM-26B を導入

ChemVLM: 化学におけるマルチモーダル大規模言語モデルの力の探求

チュートリアルの紹介

ステップの実行

関連 ノートブック

MedGemma-27b-text-it医療推論モデルのワンクリック展開

SmolLM3-3Bモデルのワンクリック展開

DeepSeek-R1-70Bのワンクリック展開

Yolov13のワンクリック展開

Ministry-3-14B-Instructのワンクリック展開

Qwen-Image-Lightningのワンクリック展開

F5-E2 TTS あらゆるサウンドをわずか 3 秒でクローン作成

Ovis-Image: 高品質画像生成モデル

Fara-7B: 非常に効率的なWebベースのインテリジェントエージェントモデル

AIでAIを構築

HyperAI Newsletters

関連 ノートブック

MedGemma-27b-text-it医療推論モデルのワンクリック展開

SmolLM3-3Bモデルのワンクリック展開

DeepSeek-R1-70Bのワンクリック展開

Yolov13のワンクリック展開

Ministry-3-14B-Instructのワンクリック展開

Qwen-Image-Lightningのワンクリック展開

F5-E2 TTS あらゆるサウンドをわずか 3 秒でクローン作成

Ovis-Image: 高品質画像生成モデル

Fara-7B: 非常に効率的なWebベースのインテリジェントエージェントモデル

関連 ノートブック

MedGemma-27b-text-it医療推論モデルのワンクリック展開

SmolLM3-3Bモデルのワンクリック展開

DeepSeek-R1-70Bのワンクリック展開

Yolov13のワンクリック展開

Ministry-3-14B-Instructのワンクリック展開

Qwen-Image-Lightningのワンクリック展開

F5-E2 TTS あらゆるサウンドをわずか 3 秒でクローン作成

Ovis-Image: 高品質画像生成モデル

Fara-7B: 非常に効率的なWebベースのインテリジェントエージェントモデル

関連ノートブック

関連ノートブック

関連ノートブック

関連ノートブック