Die Inception-Team am NSURL-2019-Aufgabe 8: Semantische Frageähnlichkeit im Arabischen

Diese Arbeit beschreibt unsere Methode zum Task Semantic Question Similarity im Arabischen im Rahmen der Workshop-Reihe NLP Solutions for Under-Resourced Languages (NSURL). Ziel ist die Entwicklung eines Modells, das in der Lage ist, semantisch ähnliche Fragen im Arabischen für die bereitgestellte Datensammlung zu erkennen. In dieser Arbeit werden verschiedene Ansätze zur Bestimmung der Frageähnlichkeit untersucht. Die vorgeschlagenen Modelle erzielen hohe F1-Scores, die zwischen 88 % und 96 % liegen. Unser offiziell bestes Ergebnis wird durch ein Ensemblesystem erzielt, das einen vortrainierten multilingualen BERT-Modell mit verschiedenen Zufallsseeds kombiniert und erreicht einen F1-Score von 95,924 %, was uns die erste Platzierung unter den neun teilnehmenden Teams sichert.