@misc{chen2024huatuogptvisioninjectingmedicalvisual, title={HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale}, author={Junying Chen and Ruyi Ouyang and Anningzhe Gao and Shunian Chen and Guiming Hardy Chen and Xidong Wang and Ruifei Zhang and Zhenyang Cai and Ke Ji and Guangjun Yu and Xiang Wan and Benyou Wang}, year={2024}, eprint={2406.19280}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2406.19280}, }

التاريخ

منذ 8 أشهر

الحجم

2.31 GB

المؤسسة

رابط الورقة البحثية

2406.19280

الترخيص

Apache 2.0

الوسوم

وصف الصورة

التصوير الطبي

PubMedVision هي مجموعة بيانات لتقييم القدرات الطبية متعددة الوسائط، أصدرها عام ٢٠٢٤ معهد شنتشن لأبحاث البيانات الضخمة، وجامعة هونغ كونغ الصينية (شنتشن)، والمعهد الوطني للبيانات الضخمة الطبية (شنتشن). نتائج البحث ذات الصلة هي:رؤية HuatuoGPT، نحو إدخال المعرفة البصرية الطبية في برامج الماجستير في القانون متعدد الوسائط على نطاق واسع"، والذي يهدف إلى توفير موارد اختبار موحدة لنماذج اللغة الكبيرة متعددة الوسائط (MLLMs) في مهام فهم النصوص البصرية الطبية لاختبار اندماج المعرفة البصرية وأداء التفكير في المجال الطبي. تحتوي هذه المجموعة من البيانات على ما يقارب 1.3 مليون مثال على إجابات الأسئلة الطبية البصرية (VQA)، بما في ذلك 647,031 مثالًا مُنسّقًا، و647,031 مثالًا آخر مُعدّلًا بدقة قائمًا على التعليمات. بُنيت البيانات من 914,960 صورة طبية مُختارة بعناية، بالإضافة إلى سياقها المُصاحب (مثل العناوين والاقتباسات النصية)، والتي تُغطي مجموعة متنوعة من أساليب التصوير الطبي والمناطق التشريحية. يتكون كل مثال من صورة ونص توضيحي من بحث طبي. تُستخدم نماذج لغوية كبيرة متعددة الوسائط (مثل GPT-4V) لإنشاء وصف الصورة والسؤال والإجابة المُقابلة.

الاستشهاد

@misc{chen2024huatuogptvisioninjectingmedicalvisual,
title={HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale},
author={Junying Chen and Ruyi Ouyang and Anningzhe Gao and Shunian Chen and Guiming Hardy Chen and Xidong Wang and Ruifei Zhang and Zhenyang Cai and Ke Ji and Guangjun Yu and Xiang Wan and Benyou Wang},
year={2024},
eprint={2406.19280},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2406.19280},
}

PubMedVision2510.torrent

البذر 2جارٍ التنزيل 0مكتمل 21إجمالي التنزيلات 159

PubMedVision2510/
- README.md
  1.94 KB
- README.txt
  3.88 KB

تم المساهمة بهذه المجموعة من البيانات من قبل مستخدمي المجتمع وهي مخصصة للأغراض التعليمية والإعلامية فقط. إذا كان أي محتوى ينطوي على انتهاك لحقوق النشر، يرجى الاتصال بنا على [email protected] للمراجعة والإزالة الفورية.

مجموعات البيانات ذات الصلة

مجموعة بيانات مرجعية لفهم تغيرات المناطق عن بعد من مركز أبحاث الاستشعار عن بعد (RSRCC)

منذ يوم واحد

مجموعة بيانات تقييم المباني المتضررة من الكوارث BRIGHT

منذ يوم واحد

مجموعة بيانات تقييم قدرة تحليل الوسائط المتعددة OmniParsingBench

منذ يوم واحد

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

HyperAI

استخدم مجموعة البيانات هذه

ناقش على Discord

التاريخ

منذ 8 أشهر

الحجم

2.31 GB

المؤسسة

رابط الورقة البحثية

2406.19280

الترخيص

Apache 2.0

الوسوم

وصف الصورة

التصوير الطبي

الاستشهاد

@misc{chen2024huatuogptvisioninjectingmedicalvisual,
title={HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale},
author={Junying Chen and Ruyi Ouyang and Anningzhe Gao and Shunian Chen and Guiming Hardy Chen and Xidong Wang and Ruifei Zhang and Zhenyang Cai and Ke Ji and Guangjun Yu and Xiang Wan and Benyou Wang},
year={2024},
eprint={2406.19280},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2406.19280},
}

PubMedVision2510.torrent

البذر 2جارٍ التنزيل 0مكتمل 21إجمالي التنزيلات 159

PubMedVision2510/
- README.md
  1.94 KB
- README.txt
  3.88 KB

مجموعات البيانات ذات الصلة

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

Command Palette

مجموعة بيانات التقييم الطبي متعدد الوسائط PubMedVision

الاستشهاد

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

مجموعة بيانات التقييم الطبي متعدد الوسائط PubMedVision

الاستشهاد

مجموعات البيانات ذات الصلة

مجموعة بيانات تقييم المعرفة الثقافية متعددة اللغات MAKIEVAL

مجموعة بيانات إعادة بناء الكائنات ثلاثية الأبعاد للفنانين SAM 3D

مجموعة بيانات صور المستندات الطبية المشوشة

فهم مخطط ChartNet لمجموعة البيانات متعددة الوسائط

مجموعة بيانات قاعدة المعرفة المستهدفة للكيميرا TACK

مجموعة بيانات EAVSD لقصص الفيديو الإعلانية للتجارة الإلكترونية

مجموعة بيانات تقييم معايير الوكلاء الأذكياء الطبيين chi-bench

استعارة فيديو Vimu لفهم مجموعة البيانات

مجموعة بيانات MemLens المعيارية متعددة الوسائط ذات السياق الطويل

مجموعة بيانات الاستدلال البصري VisCoR-55K

مجموعة بيانات MathNet متعددة الوسائط للاستدلال الرياضي المعياري

مجموعة بيانات Claw-Eval المعيارية في العالم الحقيقي

مجموعة بيانات الكشف عن النفايات الطبية

سرطان الثدي: مجموعة بيانات الدمج متعددة الوسائط

رسم بياني لمعايرة الكم QCalEval لفهم مجموعة البيانات

مجموعة بيانات مرجعية لفهم تغيرات المناطق عن بعد من مركز أبحاث الاستشعار عن بعد (RSRCC)

مجموعة بيانات تقييم المباني المتضررة من الكوارث BRIGHT

مجموعة بيانات تقييم قدرة تحليل الوسائط المتعددة OmniParsingBench

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

مجموعة بيانات التقييم الطبي متعدد الوسائط PubMedVision

الاستشهاد

مجموعات البيانات ذات الصلة

مجموعة بيانات تقييم المعرفة الثقافية متعددة اللغات MAKIEVAL

مجموعة بيانات إعادة بناء الكائنات ثلاثية الأبعاد للفنانين SAM 3D

مجموعة بيانات صور المستندات الطبية المشوشة

فهم مخطط ChartNet لمجموعة البيانات متعددة الوسائط

مجموعة بيانات قاعدة المعرفة المستهدفة للكيميرا TACK

مجموعة بيانات EAVSD لقصص الفيديو الإعلانية للتجارة الإلكترونية

مجموعة بيانات تقييم معايير الوكلاء الأذكياء الطبيين chi-bench

استعارة فيديو Vimu لفهم مجموعة البيانات

مجموعة بيانات MemLens المعيارية متعددة الوسائط ذات السياق الطويل

مجموعة بيانات الاستدلال البصري VisCoR-55K

مجموعة بيانات MathNet متعددة الوسائط للاستدلال الرياضي المعياري

مجموعة بيانات Claw-Eval المعيارية في العالم الحقيقي

مجموعة بيانات الكشف عن النفايات الطبية

سرطان الثدي: مجموعة بيانات الدمج متعددة الوسائط

رسم بياني لمعايرة الكم QCalEval لفهم مجموعة البيانات

مجموعة بيانات مرجعية لفهم تغيرات المناطق عن بعد من مركز أبحاث الاستشعار عن بعد (RSRCC)

مجموعة بيانات تقييم المباني المتضررة من الكوارث BRIGHT

مجموعة بيانات تقييم قدرة تحليل الوسائط المتعددة OmniParsingBench

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

مجموعات البيانات ذات الصلة

مجموعة بيانات تقييم المعرفة الثقافية متعددة اللغات MAKIEVAL

مجموعة بيانات إعادة بناء الكائنات ثلاثية الأبعاد للفنانين SAM 3D

مجموعة بيانات صور المستندات الطبية المشوشة

فهم مخطط ChartNet لمجموعة البيانات متعددة الوسائط

مجموعة بيانات قاعدة المعرفة المستهدفة للكيميرا TACK

مجموعة بيانات EAVSD لقصص الفيديو الإعلانية للتجارة الإلكترونية

مجموعة بيانات تقييم معايير الوكلاء الأذكياء الطبيين chi-bench

استعارة فيديو Vimu لفهم مجموعة البيانات

مجموعة بيانات MemLens المعيارية متعددة الوسائط ذات السياق الطويل

مجموعة بيانات الاستدلال البصري VisCoR-55K

مجموعة بيانات MathNet متعددة الوسائط للاستدلال الرياضي المعياري

مجموعة بيانات Claw-Eval المعيارية في العالم الحقيقي

مجموعة بيانات الكشف عن النفايات الطبية

سرطان الثدي: مجموعة بيانات الدمج متعددة الوسائط

رسم بياني لمعايرة الكم QCalEval لفهم مجموعة البيانات

مجموعة بيانات مرجعية لفهم تغيرات المناطق عن بعد من مركز أبحاث الاستشعار عن بعد (RSRCC)

مجموعة بيانات تقييم المباني المتضررة من الكوارث BRIGHT

مجموعة بيانات تقييم قدرة تحليل الوسائط المتعددة OmniParsingBench

مجموعات البيانات ذات الصلة

مجموعة بيانات تقييم المعرفة الثقافية متعددة اللغات MAKIEVAL

مجموعة بيانات إعادة بناء الكائنات ثلاثية الأبعاد للفنانين SAM 3D

مجموعة بيانات صور المستندات الطبية المشوشة

فهم مخطط ChartNet لمجموعة البيانات متعددة الوسائط

مجموعة بيانات قاعدة المعرفة المستهدفة للكيميرا TACK

مجموعة بيانات EAVSD لقصص الفيديو الإعلانية للتجارة الإلكترونية

مجموعة بيانات تقييم معايير الوكلاء الأذكياء الطبيين chi-bench