vor 16 Tagen
SIGMORPHON 2022 Shared Task zur Morphemsegmentierung: Einreichungsbeschreibung: Sequenzmarkierung für morphembasierte Wortsegmentierung
{Leander Girrbach}

Abstract
Wir schlagen einen Ansatz zur Sequenzmarkierung für die morphemische Segmentierung auf Wortebene vor. Die Segmentierungslabels basieren auf Edit-Operationen, die aus einer modifizierten Minimum-Edit-Distanz-Alignment abgeleitet werden. Wir zeigen, dass die Sequenzmarkierung für „flache Segmentierung“ und „kanonische Segmentierung“ gut abschneidet und einen F1-Score von 96,06 erzielt (makromittelwert über alle Sprachen im gemeinsamen Wettbewerb), wodurch sie den dritten Platz unter allen teilnehmenden Teams erreicht. Daher schließen wir, dass die Sequenzmarkierung ein vielversprechender Ansatz für die Morphemensegmentierung ist.