HyperAIHyperAI
vor 3 Monaten

MNet-Sim: Ein mehrschichtiges semantisches Ähnlichkeitsnetzwerk zur Bewertung der Satzähnlichkeit

Manuela Nayantara Jeyaraj, Dharshana Kasthurirathna
MNet-Sim: Ein mehrschichtiges semantisches Ähnlichkeitsnetzwerk zur Bewertung der Satzähnlichkeit
Abstract

Ähnlichkeit ist eine vergleichende, subjektive Maßgröße, die je nach betrachtetem Anwendungsbereich variiert. In mehreren Anwendungen der natürlichen Sprachverarbeitung wie Dokumentenklassifikation, Mustererkennung, Frage-Antwort-Systeme für Chatbots, Sentiment-Analyse usw. ist die Bestimmung eines genauen Ähnlichkeitsmaßes für Satzpaare zu einem zentralen Forschungsbereich geworden. Bei bestehenden Modellen zur Ähnlichkeitsbewertung haben sich mehrere Nachteile als limitierend erwiesen: die ineffektive Berechnung der Ähnlichkeit basierend auf kontextuellen Vergleichen, die Lokalisierung infolge der Zentrierungstheorie sowie der Mangel an nicht-semantischen Textvergleichen. Daher präsentiert dieser Artikel ein mehrschichtiges semantisches Ähnlichkeitsnetzwerkmodell, das auf mehreren Ähnlichkeitsmaßen basiert und ein insgesamt aggregiertes Satzähnlichkeitsmaß unter Anwendung der Prinzipien der Netzwerkwissenschaft, gewichteter benachbarter relationaler Kanten sowie einer neu vorgeschlagenen erweiterten Formel zur Knotenähnlichkeitsberechnung liefert. Das vorgeschlagene mehrschichtige Netzwerkmodell wurde anhand etablierter state-of-the-art-Modelle evaluiert und getestet und zeigte dabei eine überlegene Leistung bei der Bewertung der Satzähnlichkeit.