Untersuchung von shallow und deep Learning-Techniken zur Emotionsklassifikation in kurzen persischen Texten

Die Erkennung von Emotionen in kurzen Texten low-resource-Sprachen stellt eine erhebliche Herausforderung dar und erfordert spezialisierte Frameworks sowie Methoden der computergestützten Intelligenz. In diesem Artikel wird eine umfassende Untersuchung von shallow- und deep-learning-Methoden für die Emotionsdetektion in kurzen persischen Texten vorgestellt. Shallow-learning-Methoden setzen Merkmalsextraktion und Dimensionsreduktion ein, um die Klassifizierungsgenauigkeit zu verbessern. Im Gegensatz dazu nutzen deep-learning-Methoden Transferlernen und Wort-Embeddings, insbesondere BERT, um eine hohe Klassifizierungsgenauigkeit zu erreichen. Es wird eine persische Datensammlung namens „ShortPersianEmo“ vorgestellt, die zur Evaluation der vorgeschlagenen Ansätze dient und aus 5472 unterschiedlichen kurzen persischen Texten besteht, die in fünf Hauptemotionen klassifiziert sind. Die Evaluierungsergebnisse zeigen, dass Transferlernen und BERT-basierte Text-Embeddings im Vergleich zu alternativen Ansätzen eine bessere Leistung bei der genauen Klassifizierung kurzer persischer Texte erzielen. Die Datensammlung dieser Studie, ShortPersianEmo, wird öffentlich über https://github.com/vkiani/ShortPersianEmo zugänglich sein.