Google-KI-Suche lacht sich aus: Zählt "p", vertippt Wörter und legt Schwachstellen in der Grundarchitektur großer Modelle bloß
Die neu eingeführte KI-Übersichtsfunktion von Google hat in der Suche eine Reihe grober Fehler verursacht und Nutzer ins Lachen wie auch zum Weinen gebracht. Wie TechCrunch berichtet, antwortete die KI auf die Frage „Wie viele P sind im Wort ‚Google'?" mit „zwei", obwohl tatsächlich nur ein P vorhanden ist. Zudem behauptete das System fälschlicherweise, dass es genau einen r-Buchstaben im Wort „poop" gibt oder zwei d-Buchstaben in „journalism" – obwohl dies korrekt geschrieben wird –, und verschrieb den Nachnamen des ehemaligen US-Präsidenten als „trpum". Diese Fehler wirken zwar skurril, offenbaren jedoch grundlegende Schwachstellen großer Sprachmodelle (Large Language Models, LLM). Forscher weisen darauf hin, dass LLMs auf einer Transformer-Architektur basieren und Text nicht Buchstabe für Buchstabe lesen wie Menschen, sondern ihn in sogenannte „Tokens" zerlegen. Wenn die KI beispielsweise „the" sieht, erkennt sie lediglich eine einzige kodierte Einheit und weiß nichts über die einzelnen Buchstaben t, h und e. Sheridan Fecht, Doktorandin an der Northeastern University, erklärt: „Es gibt keine perfekte Methode zur Tokenisierung." Auch Matthew Guzdial, Assistenzprofessor an der Universität Alberta, vertritt die Ansicht, dass dieser Mangel kurzfristig kaum zu beheben sein werde. Tatsächlich ist kein neues Phänomen, wenn KI sich blamiert: Bereits zuvor hatte eine KI-Suche Inhalte satirischer Websites zitiert sowie Ratschläge gegeben, Steine zu essen oder Leim auf Pizza zu streichen. Google erklärte dazu, Zählen sei bekanntermaßen schwierig und man arbeite bereits an einer Korrektur. Doch diese wiederkehrenden Fehler erinnern uns daran, dass KI alles andere als allwissend ist und ihre Ausgaben weiterhin sorgfältig überprüft werden müssen.
