HyperAIHyperAI
vor 17 Tagen

Leistungsvergleich von Large Language Models auf dem VNHSGE-Englisch-Datensatz: OpenAI ChatGPT, Microsoft Bing Chat und Google Bard

Xuan-Quy Dao
Leistungsvergleich von Large Language Models auf dem VNHSGE-Englisch-Datensatz: OpenAI ChatGPT, Microsoft Bing Chat und Google Bard
Abstract

Diese Studie präsentiert einen Leistungsvergleich dreier großer Sprachmodelle (Large Language Models, LLMs), nämlich OpenAI ChatGPT, Microsoft Bing Chat (BingChat) und Google Bard, auf dem VNHSGE-Englisch-Datensatz. Die Leistungswerte von BingChat, Bard und ChatGPT (GPT-3.5) betragen jeweils 92,4 %, 86 % und 79,2 %. Die Ergebnisse zeigen, dass BingChat die beiden anderen Modelle übertrifft. Somit können BingChat und Bard als Ersatz für ChatGPT dienen, da ChatGPT derzeit noch nicht offiziell in Vietnam verfügbar ist. Zudem zeigen die Ergebnisse, dass BingChat, Bard und ChatGPT die Leistung von vietnamesischen Schüler:innen im Bereich Englischkenntnisse übersteigen. Die Erkenntnisse dieser Studie tragen zum Verständnis des Potenzials von LLMs in der Englischsprachausbildung bei. Die bemerkenswerte Leistung von ChatGPT, BingChat und Bard unterstreicht deren Potenzial als effektive Werkzeuge für den Englischunterricht und -lernprozess auf der Sekundarstufe.