Forscher nutzen maschinelles Lernen für ethische Transkriptionen von frühneuzeitlichen Texten.
In den letzten zwei Jahrzehnten hat die Massendigitalisierung die Landschaft der wissenschaftlichen Forschung dramatisch verändert. Die Möglichkeit, digitale Transkriptionen von Quellen nach spezifischen Schlüsselwörtern zu durchsuchen, spart wertvolle Zeit und befreit Wissenschaftler von der Notwendigkeit, Archive und Bibliotheken aufsuchen zu müssen, um einen Text zu studieren. Trotz dieser Vorteile bringt die Verbreitung digitaler Transkriptionen neue Bedenken hinsichtlich der erforderlichen Arbeitsaufwand mit sich. Ein neuer Artikel im The Sixteenth Century Journal schlägt Methoden vor, wie Forscher digitale Transkriptionen frühneuzeitlicher Quellen ethisch erlangen können. Das Werk "Unlocking the Digitized Archive of Early Modern Print: The Automatic Transcription of Early Modern Printed Books" von Serena Strecker und Kimberly Lifton beginnt mit einer kurzen Geschichte der beiden Arten von Software, die für Transkriptionen verwendet werden. Die Optical Character Recognition (OCR)-Software hat sich als gut geeignet erwiesen, um Werke des späten 19. und 20. Jahrhunderts zu transkribieren. Die Frühneuzeitler jedoch sind auf Handwritten Text Recognition (HTR)-Technologie angewiesen, da die Ungleichmäßigkeit der Schrift in frühen Drucken die OCR-Software zu unzuverlässig macht. Transkribus, die führende HTR-Software, bietet Nutzern die Möglichkeit, entweder öffentlich zugängliche Transkriptionsmodelle zu konsultieren oder eigene Modelle zu trainieren. Strecker und Lifton vergleichen verschiedene HTR-Modelle anhand ausgewählter Seiten aus vier 16. Jahrhundert Exemplarsammlungen. Sie betonen die Fähigkeit von Transkribus, die Erstellung zielgerichteter Transkriptionsmodelle in fünf grundlegenden Schritten zu erleichtern, die den Anforderungen eines Wissenschaftlers angepasst sind. Durch die Nutzung der öffentlichen Modelle von Transkribus können Forscher die notwendigen Trainingsdaten generieren, um ihre eigenen hochgenauen Modelle zu trainieren. Dieser Prozess, so argumentieren die Autoren, mache es „nicht länger notwendig oder wünschenswert", auf ausgelagerte Arbeit zu setzen, wie die von Graduierten oder Arbeitnehmern im Globalen Süden. Da die genaue und automatische Transkription frühneuzeitlicher Drucke nicht mehr ein Ziel, sondern eine Realität ist, müssen Frühneuzeitforscher überlegen, welche Kombination aus menschlicher Arbeit und maschineller Lern-Technologie akzeptiert, unterstützt und letztlich die Zukunft der Forschung gestalten wird. Die Autoren schließen ihren Artikel damit, dass nur durch die Befolgung ethischer Arbeitspraktiken Wissenschaftler vermeiden können, Ungleichheiten innerhalb der akademischen Hierarchie oder dauerhafte Kolonialungleichheiten zu verschärfen oder fortzusetzen. Industrie-Insiderbewertung: Die Arbeit von Strecker und Lifton wird von Branchenexperten als wichtiger Beitrag zur ethischen und technologischen Weiterentwicklung der Frühneuzeitforschung angesehen. Sie hebt die Notwendigkeit hervor, moderne Technologien ethisch einzusetzen, um gerechte Arbeitsbedingungen zu gewährleisten. Transkribus steht dabei als innovativer Anbieter im Mittelpunkt, der durch seine benutzerfreundlichen Tools und Modelle die Forschungsignale verstärkt. Die Autoren leisten eine wichtige Aufgabe, indem sie die potenziellen ethischen Fallen bei der Verwendung von Maschinenlernen aufzeigen und Lösungen vorschlagen, die sowohl effizient als auch moralisch vertretbar sind.