HyperAIHyperAI
منذ 2 أشهر

TXL-PBC: مجموعة بيانات خلايا الدم الطرفية المصنفة ومفتوحة الوصول

Gan, Lu ; Li, Xi
TXL-PBC: مجموعة بيانات خلايا الدم الطرفية المصنفة ومفتوحة الوصول
الملخص

في دراسة حديثة، اكتشفنا أن مجموعات البيانات العامة BCCD و BCD تعاني من مشاكل كبيرة مثل أخطاء التسمية، نقص حجم العينات، وجودة البيانات السيئة. لحل هذه المشاكل، قمنا بحذف العينات وإعادة التسمية ودمج هاتين المجموعتين من البيانات. بالإضافة إلى ذلك، قدمنا مجموعتي بيانات PBC و Raabin-WBC، وأوجدنا في النهاية مجموعة بيانات جديدة ذات جودة عالية وموزونة بالعينات أسميناها TXL-PBC. تحتوي هذه المجموعة على 1008 مجموعة تدريب، 288 مجموعة تحقق، و144 مجموعة اختبار.أولاً، خضعت المجموعة لعمليات تسمية يدوية صارمة، وتسمية آلية باستخدام نموذج YOLOv8n، وتدقيق يدوي للتأكد من دقة وتوافق التسميات. ثانياً، عالجنا مشكلة سوء تسمية خلايا الدم في المجموعات الأصلية. يتميز توزيع مساحات الصناديق الحدودية للتسميات وعددها بكونه أفضل من مجموعات BCCD و BCD. علاوة على ذلك، استخدمنا نموذج YOLOv8n لتدريب هذه الثلاثة مجموعات من البيانات، وقد أظهرت مجموعة TXL-PBC أداءً يتفوق على المجموعتين الأصليتين.أخيراً، استخدمنا نماذج الكشف YOLOv5n، YOLOv5s، YOLOv5l، YOLOv8s، YOLOv8m كنماذج أساسية لمجموعة TXL-PBC. لا تقتصر أهمية هذه الدراسة على تعزيز جودة مجموعة بيانات خلايا الدم فحسب، بل إنها تدعم الباحثين في تحسين النماذج المستخدمة للكشف عن أهداف خلايا الدم. لقد نشرنا مجموعة البيانات TXL-PBC المتاحة مجانًا على الرابط https://github.com/lugan113/TXL-PBC_Dataset.

TXL-PBC: مجموعة بيانات خلايا الدم الطرفية المصنفة ومفتوحة الوصول | أحدث الأوراق البحثية | HyperAI