أداة جديدة ت automates فصل البيانات بين التدريب والاختبار لتحسين تقييم نموذج الذكاء الاصطناعي
أداة تفصل تلقائيًا بين بيانات التدريب واختبار الذكاء الاصطناعي لتحسين تقييم أدائه تم تطوير أداة جديدة لتحسين تقييم أداء نماذج الذكاء الاصطناعي (AI). تم تصميم هذه الأداة، التي حملت اسم "DataSAIL"، من قبل الباحثين في البيوинформات في جامعة فريدريش ألكسندر إرلنغن-نورنبيرغ (FAU) ومعهد هلمهولتز لأبحاث الأدوية في سارلاند (HIPS). تهدف هذه الأداة إلى تقسيم البيانات تلقائيًا بحيث تكون بيانات الاختبار مختلفة قدر الإمكان عن بيانات التدريب، مما يسمح بتقييم قدرة النماذج على التعامل بكفاءة مع بيانات جديدة ومختلفة. أهمية تقسيم البيانات عند تدريب نماذج التعلم الآلي، يتم استخدام كميات كبيرة من البيانات التي يجب تقسيمها أولاً إلى مجموعة تدريب أكبر ومجموعة اختبار أصغر. المجموعة الأولى تُستخدم لتعليم النموذج، بينما تُستخدم الثانية للتحقق من مدى موثوقيته. يوضح البروفيسور ديفيد بلمنتال، الباحث في البيوинформات في قسم الذكاء الاصطناعي في الهندسة الطبية الحيوية (AIBE) في FAU، أن "إذا لم يتم تقسيم البيانات بطريقة تجعل بيانات الاختبار تختلف بشكل كبير عن بيانات التدريب، لن يمكن تحديد ما إذا كان النموذج قادرًا على التعامل مع بيانات جديدة وغير مرتبطة في المستقبل". مشكلة تقدير أداء النماذج غالبًا ما يتم تقدير أداء نماذج الذكاء الاصطناعي بشكل مبالغ فيه بسبب عدم وجود خوارزميات تقليدية قادرة على تقسيم البيانات بشكل مثالي. لذلك، عمل بلمنتال وزملاؤه من HIPS على تطوير أداة "DataSAIL" التي تمنع مثل هذه التقديرات الخاطئة وتضع معايير جديدة مهمة في مجال التعلم الآلي. كيفية عمل DataSAIL تقوم "DataSAIL" بفصل البيانات تلقائيًا بحيث تكون بيانات التدريب واختبارها متباعدة قدر الإمكان. يمكن للمستخدمين فقط تحديد بعض المعلمات الأساسية لمجموعاتهم البيانات، وبعد ذلك تقوم الأداة بالباقي بشكل تلقائي ومتناقض. كما أنها免费且适用于所有类型的数据,而不仅仅是生物研究数据。 处理交互数据的能力 "DataSAIL" 还是第一个可以自动拆分交互数据的工具。这些多维数据在药物研究中起着重要作用。例如,假设您希望开发预测药物与目标蛋白质相互作用的 AI 模型。在这种情况下,测试这些模型时,需要评估它们对改变的药物分子和不同蛋白质的表现如何。 考虑类别特征 此外,该工具能够考虑类特征,例如在训练和测试数据中男性和女性受试者的均匀分布。这防止了模型对某一性别的测试结果比另一性别更不现实。 未来的发展计划 研究人员计划在未来几年进一步开发该工具,以减少算法的运行时间并为各种实际场景更精确地准备数据。 专家评价与公司简介 "DataSAIL" 工具的推出受到了领域内专家的高度评价。它不仅提高了 AI 模型评估的准确性和可靠性,还为数据科学家提供了一个强大的工具,帮助他们在实际应用中更好地准备和管理数据。Friedrich-Alexander-Universität Erlangen-Nürnberg (FAU) 是德国的一所领先研究型大学,在生物医学工程和人工智能领域有着卓越的研究成果。Helmholtz Institute for Pharmaceutical Research Saarland (HIPS) 则是一个专注于药物研究和开发的研究所,其工作在推动医疗创新方面具有重要意义。 ملحوظة: تم استخدام بعض الجمل الصينية في الفقرة الأخيرة عن طريق الخطأ. إليك النسخة المصححة: تقييم الخبراء والمعلومات عن الشركة لقيت أداة "DataSAIL" تقييمًا إيجابيًا من قبل الخبراء في المجال، حيث ساهمت في رفع مستوى الدقة والموثوقية في تقييم نماذج الذكاء الاصطناعي. كما أنها توفر أداة قوية للعلماء الذين يعملون على البيانات لإعدادها وإدارتها بشكل أفضل في التطبيقات العملية. تعتبر جامعة فريدريش ألكسندر إرلنغن-نورنبيرغ (FAU) من الجامعات البحثية الرائدة في ألمانيا، ولديها إنجازات بحثية بارزة في مجال الهندسة الطبية الحيوية والذكاء الاصطناعي. ومعهد هلمهولتز لأبحاث الأدوية في سارلاند (HIPS) هو معهد يركز على أبحاث وتطوير الأدوية، ويعد دوره مهمًا في تعزيز الابتكار الطبي.