HyperAIHyperAI
منذ 2 أشهر

ثيرابيوتيكس داتا كومونز: مجموعات بيانات ومهام التعلم الآلي لاكتشاف وتطوير الأدوية

Kexin Huang; Tianfan Fu; Wenhao Gao; Yue Zhao; Yusuf Roohani; Jure Leskovec; Connor W. Coley; Cao Xiao; Jimeng Sun; Marinka Zitnik
ثيرابيوتيكس داتا كومونز: مجموعات بيانات ومهام التعلم الآلي لاكتشاف وتطوير الأدوية
الملخص

التعلم الآلي العلاجي هو مجال ناشئ يحمل فرصًا مذهلة للابتكار والتأثير. ومع ذلك، يتطلب التقدم في هذا المجال صياغة مهام تعلم ذات معنى ورعاية دقيقة للمجموعات البيانات. هنا، نقدم منصة Therapeutics Data Commons (TDC)، وهي أول منصة موحدة توفر الوصول والتقدير المنهجي للتعلم الآلي عبر نطاق العلاجات بأكمله. حتى الآن، تشمل TDC 66 مجموعة بيانات جاهزة للذكاء الاصطناعي موزعة على 22 مهمة تعلم وتغطي اكتشاف وتطوير الأدوية الآمنة والفعالة. كما توفر TDC نظامًا بيئيًا من الأدوات والمصادر المجتمعية، بما في ذلك 33 دالة بيانات وأنواع تقسيمات البيانات ذات المعنى، و23 استراتيجية لتقييم النماذج بشكل منهجي، و17 برمجة جزيئية أوكلات (oracles)، و29 لوحة تصنيف عامة. جميع المصادر متكاملة ومتوفرة عبر مكتبة Python المفتوحة. نقوم بإجراء تجارب واسعة النطاق على مجموعات بيانات مختارة، مما يثبت أن حتى أقوى الخوارزميات لا تزال قاصرة عن حل التحديات الرئيسية في مجال العلاجات، بما في ذلك التغيرات التوزيعية الحقيقية في مجموعات البيانات، والنمذجة متعددة المقاييس للبيانات غير المتجانسة، والعمومية القوية لنقاط البيانات الجديدة. نتصور أن TDC يمكن أن تسهل التقدم الخوارزمي والعلمي وتسرع بشكل كبير تطوير وتقييم النماذج القائمة على التعلم الآلي وانتقالها إلى التطبيق البيولوجي والسريري. TDC هي مبادرة علم مفتوح متاحة على https://tdcommons.ai.

ثيرابيوتيكس داتا كومونز: مجموعات بيانات ومهام التعلم الآلي لاكتشاف وتطوير الأدوية | أحدث الأوراق البحثية | HyperAI