TRR360D: Ein Datensatz für die Erkennung von rechteckigen Tabellenboxen bei 360-Grad-Drehung

Um das Problem der Knappheit und der hohen Annotationskosten von Datensätzen für rotierte Tabellenerkennung zu bewältigen, wird in diesem Artikel eine Methode zur Erstellung eines Datensatzes für die rotierte Tabellenerkennung vorgestellt. Aufbauend auf dem ICDAR2019MTD-Datensatz für die moderne Tabellenerkennung wird anhand des Annotationstyps des DOTA-Datensatzes der TRR360D-Datensatz für die rotierte Tabellenerkennung erstellt. Der Trainingsdatensatz umfasst 600 rotierte Bilder mit insgesamt 977 annotierten Instanzen, während der Testdatensatz 240 rotierte Bilder und 499 annotierte Instanzen enthält. Es wird die Evaluationsmetrik AP50(T<90) definiert, wodurch der Datensatz zukünftigen Forschern zur Untersuchung von Algorithmen zur rotierten Tabellenerkennung zur Verfügung steht und die Entwicklung der Tabellenerkennungstechnologie fördern soll. Der TRR360D-Datensatz für die rotierte Tabellenerkennung wurde durch Festlegung des Startpunkts und der Annotationsrichtung erstellt und ist öffentlich über https://github.com/vansin/TRR360D zugänglich.