HyperAIHyperAI
vor 2 Monaten

TXL-PBC: ein frei zugängliches, beschriftetes Datensatz von peripheren Blutzellen

Gan, Lu ; Li, Xi
TXL-PBC: ein frei zugängliches, beschriftetes Datensatz von peripheren Blutzellen
Abstract

In einer kürzlichen Studie haben wir festgestellt, dass die öffentlich zugänglichen BCCD- und BCD-Datensätze erhebliche Probleme aufweisen, wie z.B. Beschriftungsfehler, unzureichende Stichprobengröße und mangelnde Datenqualität. Um diese Probleme zu beheben, führten wir Schritte zur Stichprobenlöschung, Neubeschriftung und Integration dieser beiden Datensätze durch. Zudem stellten wir die PBC- und Raabin-WBC-Datensätze vor und schufen letztendlich einen hochwertigen, ausgewogenen neuen Datensatz, den wir TXL-PBC nannten. Der Datensatz enthält 1008 Trainingsmengen, 288 Validierungsmengen und 144 Testmengen.Zunächst wurde der Datensatz durch strenge manuelle Annotation, automatische Annotation mit dem YOLOv8n-Modell sowie manuelle Überprüfungsschritte verarbeitet, um die Genauigkeit und Konsistenz der Annotationen zu gewährleisten. Zweitens korrigierten wir das Problem der fehlerhaften Beschriftung von Blutkörperchen in den ursprünglichen Datensätzen. Die Verteilung der Flächen von Label-Bounding-Boxen und die Anzahl der Labels ist besser als bei den BCCD- und BCD-Datensätzen. Darüber hinaus trainierten wir diese drei Datensätze mit dem YOLOv8n-Modell; die Leistung des TXL-PBC-Datensatzes übertrifft die der beiden ursprünglichen Datensätze.Schließlich setzten wir die Detektionsmodelle YOLOv5n, YOLOv5s, YOLOv5l, YOLOv8s und YOLOv8m als Basismodelle für TXL-PBC ein. Diese Studie verbessert nicht nur die Qualität des Blutkörperchendatensatzes, sondern unterstützt auch Forscher bei der Optimierung von Modellen für die Zielerkennung von Blutkörperchen. Wir veröffentlichten unseren frei zugänglichen TXL-PBC-Datensatz unter https://github.com/lugan113/TXL-PBC_Dataset.

TXL-PBC: ein frei zugängliches, beschriftetes Datensatz von peripheren Blutzellen | Neueste Forschungsarbeiten | HyperAI