@misc{zhang2024chemllm, title={ChemLLM: A Chemical Large Language Model}, author={Di Zhang and Wei Liu and Qian Tan and Jingdan Chen and Hang Yan and Yuliang Yan and Jiatong Li and Weiran Huang and Xiangyu Yue and Dongzhan Zhou and Shufei Zhang and Mao Su and Han-Sen Zhong and Yuqiang Li and Wanli Ouyang}, year={2024}, eprint={2402.06852}, archivePrefix={arXiv}, primaryClass={cs.AI} }

التاريخ

منذ 2 أعوام

الحجم

242.89 MB

المؤسسة

رابط الورقة البحثية

arxiv.org

الوسوم

ذكاء اصطناعي للعلوم

مقدمة مجموعة البيانات

تم توفير هذه المجموعة من البيانات مفتوحة المصدر بواسطة مختبر الذكاء الاصطناعي في شنغهاي في عام 2024 جنبًا إلى جنب مع أول نموذج علمي كبير، وهو نموذج Pu Ke Chemical Big Model (ChemLLM). "نتائج الورقة ذات الصلة هي"ChemLLM: نموذج اللغة الكيميائية الكبيرة". تتضمن مجموعة البيانات بشكل أساسي ChemData700K. كما قام فريق البحث أيضًا بإتاحة الإصدارات الصينية والإنجليزية من ChemBench-4K وChemPref-10K ومجموعة بيانات C-MHChem مفتوحة المصدر.

مجموعة بيانات ChemData700K

ChemData700K عبارة عن مجموعة بيانات كبيرة لضبط تعليمات قدرات الكيمياء النموذجية اللغوية والتي تتضمن 9 مهام كيميائية أساسية و730 ألف سؤال وإجابة عالية الجودة، تم أخذ عينات منها من 1/10 من 7 ملايين بيانات. تغطي مجموعة البيانات مجموعة واسعة من المعرفة في المجال الكيميائي وتنقسم إلى 3 فئات رئيسية للمهام (الجزيئات والتفاعلات والمجالات).

مجموعة بيانات معيارية ChemBench4K

ChemBench هو معيار مبتكر يتكون من 9 مهام حول الجزيئات والتفاعلات الكيميائية. هذه المهام التسع هي نفسها تلك الموجودة في ChemData. يوفر هذا المعيار أساسًا لقياس كفاءة ماجستير قانون الكيمياء بشكل موضوعي. يحتوي ChemBench على 4100 سؤال اختيار من متعدد بإجابة صحيحة واحدة.

مجموعة بيانات ChemPref-10K

يمكن استخدام مجموعة البيانات هذه لتحسين نماذج اللغة لتتوافق مع التفضيلات البشرية، وتحتوي على إصدارات باللغتين الإنجليزية والصينية.

مجموعة بيانات C-MHChem

C-MHChem هو اختبار معياري عالي الجودة، مكتوب يدويًا بالكامل، متعدد الاختيارات، يتكون من 600 سؤال تم جمعها من امتحانات القبول في المدارس الإعدادية والثانوية والجامعية في أجزاء مختلفة من الصين على مدى السنوات الخمس والعشرين الماضية.

الاستشهاد

@misc{zhang2024chemllm,
title={ChemLLM: A Chemical Large Language Model},
author={Di Zhang and Wei Liu and Qian Tan and Jingdan Chen and Hang Yan and Yuliang Yan and Jiatong Li and Weiran Huang and Xiangyu Yue and Dongzhan Zhou and Shufei Zhang and Mao Su and Han-Sen Zhong and Yuqiang Li and Wanli Ouyang},
year={2024},
eprint={2402.06852},
archivePrefix={arXiv},
primaryClass={cs.AI}
}

ChemLLM-Dataset.torrent

البذر 1جارٍ التنزيل 0مكتمل 272إجمالي التنزيلات 924

ChemLLM-Dataset/
- README.md
  2.09 KB
- README.txt
  4.18 KB

تم المساهمة بهذه المجموعة من البيانات من قبل مستخدمي المجتمع وهي مخصصة للأغراض التعليمية والإعلامية فقط. إذا كان أي محتوى ينطوي على انتهاك لحقوق النشر، يرجى الاتصال بنا على [email protected] للمراجعة والإزالة الفورية.

مجموعات البيانات ذات الصلة

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

HyperAI

استخدم مجموعة البيانات هذه

ناقش على Discord

التاريخ

منذ 2 أعوام

الحجم

242.89 MB

المؤسسة

رابط الورقة البحثية

arxiv.org

الوسوم

ذكاء اصطناعي للعلوم

مقدمة مجموعة البيانات

مجموعة بيانات ChemData700K

مجموعة بيانات معيارية ChemBench4K

مجموعة بيانات ChemPref-10K

مجموعة بيانات C-MHChem

الاستشهاد

@misc{zhang2024chemllm,
title={ChemLLM: A Chemical Large Language Model},
author={Di Zhang and Wei Liu and Qian Tan and Jingdan Chen and Hang Yan and Yuliang Yan and Jiatong Li and Weiran Huang and Xiangyu Yue and Dongzhan Zhou and Shufei Zhang and Mao Su and Han-Sen Zhong and Yuqiang Li and Wanli Ouyang},
year={2024},
eprint={2402.06852},
archivePrefix={arXiv},
primaryClass={cs.AI}
}

ChemLLM-Dataset.torrent

البذر 1جارٍ التنزيل 0مكتمل 272إجمالي التنزيلات 924

ChemLLM-Dataset/
- README.md
  2.09 KB
- README.txt
  4.18 KB

مجموعات البيانات ذات الصلة

مجموعة بيانات تقييم المعرفة الثقافية متعددة اللغات MAKIEVAL

منذ 10 ساعات

مجموعة بيانات إعادة بناء الكائنات ثلاثية الأبعاد للفنانين SAM 3D

منذ 3 أيام

مجموعة بيانات مرجعية لتوليد الرسوم التوضيحية العلمية من FigureBench

منذ 5 أيام

مجموعة بيانات SMOL للترجمة المتوازية متعددة اللغات

منذ 24 أيام

مجموعة بيانات تقييم معايير الوكلاء الأذكياء الطبيين chi-bench

منذ 11 أيام

مجموعة بيانات الاستدلال البصري VisCoR-55K

منذ شهر واحد

رسم بياني لمعايرة الكم QCalEval لفهم مجموعة البيانات

منذ 2 أشهر

مجموعة بيانات MDPBench المعيارية لتحليل المستندات متعددة اللغات

منذ 6 أيام

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

Command Palette

مجموعة بيانات المهام الكيميائية ChemData

مقدمة مجموعة البيانات

مجموعة بيانات ChemData700K

مجموعة بيانات معيارية ChemBench4K

مجموعة بيانات ChemPref-10K

مجموعة بيانات C-MHChem

الاستشهاد

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

مجموعة بيانات المهام الكيميائية ChemData

مقدمة مجموعة البيانات

مجموعة بيانات ChemData700K

مجموعة بيانات معيارية ChemBench4K

مجموعة بيانات ChemPref-10K

مجموعة بيانات C-MHChem

الاستشهاد

مجموعات البيانات ذات الصلة

مجموعة بيانات تقييم المعرفة الثقافية متعددة اللغات MAKIEVAL

مجموعة بيانات إعادة بناء الكائنات ثلاثية الأبعاد للفنانين SAM 3D

مجموعة بيانات مرجعية لتوليد الرسوم التوضيحية العلمية من FigureBench

مجموعة بيانات SMOL للترجمة المتوازية متعددة اللغات

مجموعة بيانات تقييم معايير الوكلاء الأذكياء الطبيين chi-bench

مجموعة بيانات الاستدلال البصري VisCoR-55K

رسم بياني لمعايرة الكم QCalEval لفهم مجموعة البيانات

مجموعة بيانات MDPBench المعيارية لتحليل المستندات متعددة اللغات

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

مجموعة بيانات المهام الكيميائية ChemData

مقدمة مجموعة البيانات

مجموعة بيانات ChemData700K

مجموعة بيانات معيارية ChemBench4K

مجموعة بيانات ChemPref-10K

مجموعة بيانات C-MHChem

الاستشهاد

مجموعات البيانات ذات الصلة

مجموعة بيانات تقييم المعرفة الثقافية متعددة اللغات MAKIEVAL

مجموعة بيانات إعادة بناء الكائنات ثلاثية الأبعاد للفنانين SAM 3D

مجموعة بيانات مرجعية لتوليد الرسوم التوضيحية العلمية من FigureBench

مجموعة بيانات SMOL للترجمة المتوازية متعددة اللغات

مجموعة بيانات تقييم معايير الوكلاء الأذكياء الطبيين chi-bench

مجموعة بيانات الاستدلال البصري VisCoR-55K

رسم بياني لمعايرة الكم QCalEval لفهم مجموعة البيانات

مجموعة بيانات MDPBench المعيارية لتحليل المستندات متعددة اللغات

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

مجموعات البيانات ذات الصلة

مجموعة بيانات تقييم المعرفة الثقافية متعددة اللغات MAKIEVAL

مجموعة بيانات إعادة بناء الكائنات ثلاثية الأبعاد للفنانين SAM 3D

مجموعة بيانات مرجعية لتوليد الرسوم التوضيحية العلمية من FigureBench

مجموعة بيانات SMOL للترجمة المتوازية متعددة اللغات

مجموعة بيانات تقييم معايير الوكلاء الأذكياء الطبيين chi-bench

مجموعة بيانات الاستدلال البصري VisCoR-55K

رسم بياني لمعايرة الكم QCalEval لفهم مجموعة البيانات

مجموعة بيانات MDPBench المعيارية لتحليل المستندات متعددة اللغات

مجموعات البيانات ذات الصلة

مجموعة بيانات تقييم المعرفة الثقافية متعددة اللغات MAKIEVAL

مجموعة بيانات إعادة بناء الكائنات ثلاثية الأبعاد للفنانين SAM 3D

مجموعة بيانات مرجعية لتوليد الرسوم التوضيحية العلمية من FigureBench

مجموعة بيانات SMOL للترجمة المتوازية متعددة اللغات

مجموعة بيانات تقييم معايير الوكلاء الأذكياء الطبيين chi-bench

مجموعة بيانات الاستدلال البصري VisCoR-55K

رسم بياني لمعايرة الكم QCalEval لفهم مجموعة البيانات

مجموعة بيانات MDPBench المعيارية لتحليل المستندات متعددة اللغات