مقدمة البرنامج التعليمي

ChemVLM هو أول نموذج لغوي واسع النطاق متعدد الوسائط مفتوح المصدر لمجال الكيمياء أطلقه مختبر الذكاء الاصطناعي في شنغهاي في عام 2024. يهدف النموذج إلى حل عدم التوافق بين فهم الصور الكيميائية وتحليل النصوص. من خلال الجمع بين مزايا المحول المرئي (ViT) والإدراك متعدد الطبقات (MLP) ونموذج اللغة الكبير (LLM)، فإنه يحقق التفكير الشامل للصور والنصوص الكيميائية. يعتمد ChemVLM على بنية VIT-MLP-LLM، ويتبنى ChemLLM-20B كنموذج أساسي واسع النطاق، ويعزز قدرة النموذج على فهم واستخدام المعرفة النصية الكيميائية، ويستخدم InternVIT-6B كمشفر للصور. بالإضافة إلى ذلك، قام فريق البحث باختيار بيانات عالية الجودة بعناية بما في ذلك الجزيئات وصيغ التفاعل وبيانات اختبار الكيمياء من مجال الكيمياء، وقاموا ببناء مجموعة بيانات ثنائية اللغة ومتعددة الوسائط للإجابة على الأسئلة لتحسين أداء النموذج بشكل أكبر.

خطوات التشغيل

1. 克隆并成功启动容器后点击 API 地址即可进入 Web 界面（由于模型较大，成功启动容器后需要等待约 2 分钟才会在 API 地址显示 Web 界面）

2. 可以选择设置相关采样参数（不同的采样参数效果可能不同），然后上传化学图像继续与模型进行对话，例如下图

点击提交即可看到模型输出结果

HyperAI

تشغيل هذا Notebook ناقش على Discord

التاريخ

منذ عام واحد

الحجم

832.12 MB

الوسوم

ذكاء اصطناعي للعلوم

ChemVLM: استكشاف قوة نماذج اللغة متعددة الوسائط الكبيرة في الكيمياء

مقدمة البرنامج التعليمي

خطوات التشغيل

1. 克隆并成功启动容器后点击 API 地址即可进入 Web 界面（由于模型较大，成功启动容器后需要等待约 2 分钟才会在 API 地址显示 Web 界面）

2. 可以选择设置相关采样参数（不同的采样参数效果可能不同），然后上传化学图像继续与模型进行对话，

例如下图

点击提交即可看到模型输出结果

تم المساهمة في هذا الدفتر من قبل مستخدمي المجتمع وهو مخصص لأغراض تعليمية وإعلامية فقط. إذا كان أي محتوى ينطوي على انتهاك لحقوق النشر، يرجى الاتصال بنا على [email protected] للمراجعة والإزالة الفورية.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

HyperAI

تشغيل هذا Notebook ناقش على Discord

التاريخ

منذ عام واحد

الحجم

832.12 MB

الوسوم

ذكاء اصطناعي للعلوم

ChemVLM: استكشاف قوة نماذج اللغة متعددة الوسائط الكبيرة في الكيمياء

مقدمة البرنامج التعليمي

خطوات التشغيل

1. 克隆并成功启动容器后点击 API 地址即可进入 Web 界面（由于模型较大，成功启动容器后需要等待约 2 分钟才会在 API 地址显示 Web 界面）

2. 可以选择设置相关采样参数（不同的采样参数效果可能不同），然后上传化学图像继续与模型进行对话，

例如下图

点击提交即可看到模型输出结果

نشر نموذج الاستدلال الطبي MedGemma-27b-text-it بنقرة واحدة

منذ 3 أشهر

نشر نموذج SmolLM3-3B بنقرة واحدة

منذ 3 أشهر

نشر DeepSeek-R1-70B بنقرة واحدة

منذ 3 أشهر

نشر Ministry-3-14B-Instruct بنقرة واحدة

منذ 2 أشهر

نشر Qwen-Image-Lightning بنقرة واحدة

منذ 2 أشهر

يقوم برنامج F5-E2 TTS باستنساخ أي صوت في 3 ثوانٍ فقط

منذ 2 أشهر

Ovis-Image: نموذج توليد صور عالية الجودة

منذ 2 أشهر

فارا-7ب: نموذج وكيل ذكي عالي الكفاءة قائم على الويب

منذ 21 أيام

Docling: أداة تحليل المستندات

منذ 2 أشهر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

Command Palette

نشر ChemVLM-26B بنقرة واحدة

ChemVLM: استكشاف قوة نماذج اللغة متعددة الوسائط الكبيرة في الكيمياء

مقدمة البرنامج التعليمي

خطوات التشغيل

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

نشر ChemVLM-26B بنقرة واحدة

ChemVLM: استكشاف قوة نماذج اللغة متعددة الوسائط الكبيرة في الكيمياء

مقدمة البرنامج التعليمي

خطوات التشغيل

ذات صلة دفاتر تفاعلية

نشر نموذج الاستدلال الطبي MedGemma-27b-text-it بنقرة واحدة

نشر نموذج SmolLM3-3B بنقرة واحدة

نشر DeepSeek-R1-70B بنقرة واحدة

نشر Ministry-3-14B-Instruct بنقرة واحدة

نشر Qwen-Image-Lightning بنقرة واحدة

يقوم برنامج F5-E2 TTS باستنساخ أي صوت في 3 ثوانٍ فقط

Ovis-Image: نموذج توليد صور عالية الجودة

فارا-7ب: نموذج وكيل ذكي عالي الكفاءة قائم على الويب

Docling: أداة تحليل المستندات

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

نشر ChemVLM-26B بنقرة واحدة

ChemVLM: استكشاف قوة نماذج اللغة متعددة الوسائط الكبيرة في الكيمياء

مقدمة البرنامج التعليمي

خطوات التشغيل

ذات صلة دفاتر تفاعلية

نشر نموذج الاستدلال الطبي MedGemma-27b-text-it بنقرة واحدة

نشر نموذج SmolLM3-3B بنقرة واحدة

نشر DeepSeek-R1-70B بنقرة واحدة

نشر Ministry-3-14B-Instruct بنقرة واحدة

نشر Qwen-Image-Lightning بنقرة واحدة

يقوم برنامج F5-E2 TTS باستنساخ أي صوت في 3 ثوانٍ فقط

Ovis-Image: نموذج توليد صور عالية الجودة

فارا-7ب: نموذج وكيل ذكي عالي الكفاءة قائم على الويب

Docling: أداة تحليل المستندات

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

ذات صلة دفاتر تفاعلية

نشر نموذج الاستدلال الطبي MedGemma-27b-text-it بنقرة واحدة

نشر نموذج SmolLM3-3B بنقرة واحدة

نشر DeepSeek-R1-70B بنقرة واحدة

نشر Ministry-3-14B-Instruct بنقرة واحدة

نشر Qwen-Image-Lightning بنقرة واحدة

يقوم برنامج F5-E2 TTS باستنساخ أي صوت في 3 ثوانٍ فقط

Ovis-Image: نموذج توليد صور عالية الجودة

فارا-7ب: نموذج وكيل ذكي عالي الكفاءة قائم على الويب

Docling: أداة تحليل المستندات

ذات صلة دفاتر تفاعلية

نشر نموذج الاستدلال الطبي MedGemma-27b-text-it بنقرة واحدة

نشر نموذج SmolLM3-3B بنقرة واحدة

نشر DeepSeek-R1-70B بنقرة واحدة

نشر Ministry-3-14B-Instruct بنقرة واحدة

نشر Qwen-Image-Lightning بنقرة واحدة

يقوم برنامج F5-E2 TTS باستنساخ أي صوت في 3 ثوانٍ فقط

Ovis-Image: نموذج توليد صور عالية الجودة

فارا-7ب: نموذج وكيل ذكي عالي الكفاءة قائم على الويب

Docling: أداة تحليل المستندات