HyperAI

ملخص لعشر مجموعات بيانات طبية صينية رئيسية: تغطي طب شينونغ الصيني، وكتب الطب الصيني القديم، والمنطق الطبي، والأسئلة والأجوبة الطبية...

特色图像

لا يمكن فصل التطور السريع للذكاء الاصطناعي الطبي عن دعم مجموعات البيانات عالية الجودة. من تشخيص الأمراض إلى تطوير الأدوية إلى الطب الشخصي، تلعب مجموعات البيانات دورًا لا غنى عنه في تعزيز تطبيق الرؤية الآلية والنماذج الكبيرة وما إلى ذلك في المجال الطبي.

تأتي مجموعات البيانات الطبية بأشكال مختلفة، وتغطي موارد البيانات في أبعاد ومجالات مختلفة. على سبيل المثال، في مجال تشخيص الأمراض، تعمل مجموعات البيانات الخاصة بالإجابة على الأسئلة مثل RJUA-QA على تعزيز التطبيق الآلي للمعرفة الطبية المعقدة؛ وفي مجال الطب الصيني التقليدي، تدمج مجموعة بيانات شينونغ للطب الصيني التقليدي أدبيات الطب الصيني التقليدي والحالات السريرية وبيانات الوصفات الطبية.

ولتحقيق هذه الغاية، تنظم هذه المقالة 10 مجموعات بيانات في المجال الطبي، تغطي الطب الصيني التقليدي في شينونغ، وكتب الطب الصيني القديم، والمنطق الطبي، والأسئلة والأجوبة الطبية... بهدف مساعدة الباحثين على فهم توزيع وخصائص موارد البيانات هذه بسرعة وتوفير الإلهام لتطبيقها في مشاكل بحثية محددة.

انقر هنا لعرض المزيد من مجموعات البيانات مفتوحة المصدر:

https://go.hyper.ai/SjWDr

امسح رمز الاستجابة السريعة وأضف "مجموعة البيانات" للانضمام إلى مجموعة المناقشة↓

ملخص مجموعات البيانات الطبية الصينية

1. أول مجموعة بيانات استدلالية للإجابة على الأسئلة في التخصصات الطبية الصينية

الحجم المقدر:2.34 ميجابايت

عنوان التنزيل:https://go.hyper.ai/rIwcK

هذه المجموعة من البيانات هي مجموعة بيانات مبتكرة للإجابة على الأسئلة في مجال طب المسالك البولية، أنشأها فريق Ant Group Medical LLM (نموذج اللغة الكبيرة) بالتعاون مع فريق خبراء طب المسالك البولية في مستشفى Renji التابع لكلية الطب بجامعة شنغهاي جياو تونغ. يتم تقديمه بصيغة Q-context-A (سؤال-سياق-إجابة)، حيث يتم كتابة بيانات الحالة من قبل أطباء محترفين بناءً على الخبرة السريرية ولا ينطوي على أي خصوصية شخصية للمرضى والأطباء.

2. مجموعة بيانات الإجابة على الأسئلة الطبية الصينية

الحجم المقدر:279.64 ميجابايت

عنوان التنزيل:https://go.hyper.ai/lM5sd

هذه المجموعة من البيانات عبارة عن مجموعة بيانات طبية صينية للأسئلة والأجوبة، والتي تحتوي على 6 مجلدات مختلفة من الأقسام الطبية، وهي: طب الذكورة (94,596 زوجًا من الأسئلة والأجوبة)، الطب الباطني (220,606 زوجًا من الأسئلة والأجوبة)، طب التوليد وأمراض النساء (183,751 زوجًا من الأسئلة والأجوبة)، علم الأورام (75,553 زوجًا من الأسئلة والأجوبة)، طب الأطفال (101,602 زوجًا من الأسئلة والأجوبة)، الجراحة (115,991 زوجًا من الأسئلة والأجوبة)، بإجمالي 792,099 نقطة بيانات. يوجد ملف csv في كل مجلد.

3. مجموعة بيانات الحوار الطبي

الحجم المقدر:118.35 ميجابايت

عنوان التنزيل:https://go.hyper.ai/MCH57

هذه مجموعة بيانات تجريبية مصممة لتشغيل روبوتات الدردشة الطبية، والتي تحتوي على 256,916 محادثة بين المرضى والأطباء.

4. مجموعة بيانات الطب الصيني التقليدي في شينونغ

الحجم المقدر:28.98 ميجابايت

عنوان التنزيل:https://go.hyper.ai/iJsGu

تم تصميم مجموعة البيانات هذه خصيصًا لتدريب وتقييم نماذج اللغة واسعة النطاق في مجال الطب الصيني التقليدي. يحتوي على أكثر من 110,000 من بيانات التعليمات، والتي يتم إنشاؤها من خلال طريقة التعليم الذاتي التي تركز على الكيان. يركز على الكيانات الأساسية وسيناريوهات النوايا المختلفة في مجال الطب الصيني التقليدي. لا يمكنه فقط تحسين قدرة النموذج على الإجابة على الأسئلة المتعلقة بالطب الصيني التقليدي، بل يساعد أيضًا في تشخيص الطب الصيني التقليدي وتقديم المشورة الطبية الشخصية.

5. مجموعة بيانات كتب الطب الصيني التقليدي القديمة

الحجم المقدر:80.49 ميجابايت

عنوان التنزيل:https://go.hyper.ai/pyHEs

تحتوي مجموعة البيانات هذه على حوالي 700 نص في الطب الصيني القديم، تغطي الكلاسيكيات الطبية من فترة ما قبل أسرة تشين إلى أواخر أسرة تشينغ وجمهورية الصين. لا تتضمن هذه الوثائق النظريات الطبية والوصفات الطبية وعلم الأدوية وما إلى ذلك فحسب، بل تحتوي أيضًا على حالات سريرية غنية ومعرفة موسوعية طبية.

6. مجموعة بيانات تشخيص الطب الصيني التقليدي

الحجم المقدر:341.69 ميجابايت

عنوان التنزيل:https://go.hyper.ai/cIHaP

تُعد مجموعة البيانات هذه مجموعة بيانات عالية الجودة تركز على مجال الطب الصيني التقليدي، وتحتوي على حوالي 1 جيجابايت من المحتوى عالي الجودة مثل الحالات السريرية في مختلف مجالات الطب الصيني التقليدي، والكتب الشهيرة، والموسوعات الطبية، والقواميس. تتكون مجموعة البيانات بشكل أساسي من بيانات داخلية من مصادر غير شبكية. 99% مكتوب باللغة الصينية المبسطة بجودة ممتازة وكثافة معلومات كبيرة، مما يجعله مناسبًا لأغراض التدريب المسبق أو التدريب المسبق المستمر.

7. مجموعة بيانات حوار الطب الصيني التقليدي

الحجم المقدر:737.32 ميجابايت

عنوان التنزيل:https://go.hyper.ai/cCrcT

تُعد مجموعة البيانات الطبية الصينية هذه موردًا شاملاً لتطوير وتدريب نماذج اللغة القادرة على تقديم محادثات وتوصيات مهنية في المجال الطبي. ويجمع هذا النموذج بين أنواع متعددة من البيانات، بما في ذلك المعرفة الموسوعية، ونصوص الكتب المدرسية، والمحادثات الفعلية بين الطبيب والمريض، وبيانات التقييم، لتحسين دقة النموذج وعمليته.

8. مجموعة بيانات الاستدلال الطبي

عنوان التنزيل:https://go.hyper.ai/BAVNR

تم إصدار مجموعة البيانات هذه من قبل جامعة هونج كونج الصينية ومعهد شنتشن للبيانات الضخمة في عام 2024. وهي مصممة لضبط نموذج اللغة الطبية الكبير HuatuoGPT-o1 لتحسين أدائه في مهام التفكير الطبي المعقدة.

9. مجموعة بيانات معيارية لاختبار الكفاءة الطبية متعدد اللغات

الحجم المقدر:20.69 ميجابايت

عنوان التنزيل:https://go.hyper.ai/ux6FF

هذه المجموعة من البيانات هي مجموعة بيانات شاملة لاختبار الكفاءة الطبية متعددة اللغات تم تطويرها من قبل فريق الرعاية الصحية الذكية في كلية الذكاء الاصطناعي بجامعة شنغهاي جياو تونغ في عام 2024. وتهدف إلى تقييم تطوير النماذج متعددة اللغات في المجال الطبي وتغطي 6 لغات و 21 مجالًا فرعيًا طبيًا.

10 ، مجموعة MMedC الطبية متعددة اللغات واسعة النطاق

الحجم المقدر:31.05 جيجابايت

عنوان التنزيل:https://go.hyper.ai/K8RcQ

هذه المجموعة من البيانات عبارة عن مجموعة بيانات طبية متعددة اللغات أنشأها فريق الرعاية الصحية الذكية بكلية الذكاء الاصطناعي بجامعة شنغهاي جياو تونغ في عام 2024. تحتوي على ما يقرب من 25.5 مليار رمز وتغطي 6 لغات رئيسية: الإنجليزية والصينية واليابانية والفرنسية والروسية والإسبانية.

ما ورد أعلاه هو مجموعة البيانات الطبية الصينية التي جمعتها شركة HyperAI. إذا كان لديك موارد تريد تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك لترك رسالة أو تقديم مساهمة لإخبارنا بها!

حول HyperAI

HyperAI (hyper.ai) هي شركة رائدة في مجال الذكاء الاصطناعي والحوسبة عالية الأداء في الصين.نحن ملتزمون بأن نصبح البنية التحتية في مجال علوم البيانات في الصين وتوفير موارد عامة غنية وعالية الجودة للمطورين المحليين. حتى الآن، لدينا:

* توفير عقد تنزيل محلية سريعة لأكثر من 1300 مجموعة بيانات عامة

* يتضمن أكثر من 400 برنامج تعليمي كلاسيكي وشائع عبر الإنترنت

* تفسير أكثر من 200 حالة بحثية من AI4Science

* دعم البحث عن أكثر من 500 مصطلح ذي صلة

* استضافة أول وثائق كاملة حول Apache TVM باللغة الصينية في الصين

قم بزيارة الموقع الرسمي لبدء رحلة التعلم الخاصة بك:

https://hyper.ai