HyperAIHyperAI

Command Palette

Search for a command to run...

KI und Menschen verstehen „wahrscheinlich“ unterschiedlich – Studie zeigt Kommunikationslücke bei Unsicherheit

Wenn Menschen von „wahrscheinlich“ oder „wahrscheinlich“ sprechen, teilen sie eine vage, aber gemeinsame Vorstellung davon, was diese Worte bedeuten. Doch bei KI-Chatbots wie ChatGPT ist das anders: Die Wörter werden nicht nach menschlicher Wahrnehmung von Wahrscheinlichkeit interpretiert, wie eine kürzlich in der Zeitschrift npj Complexity veröffentlichte Studie zeigt. Die Forschung untersuchte, wie große Sprachmodelle Ausdrücke der unsicheren Prognose – wie „vielleicht“, „wahrscheinlich“ oder „fast sicher“ – mit Zahlen verbinden, und fand erhebliche Abweichungen gegenüber menschlichen Interpretationen. Während die Modelle bei Extremwerten wie „unmöglich“ oft mit Menschen übereinstimmen, zeigen sie deutliche Differenzen bei unscharfen Begriffen. So kann „wahrscheinlich“ bei einem Modell eine 80-Prozent-Wahrscheinlichkeit bedeuten, während Menschen darunter typischerweise etwa 65 Prozent verstehen. Dies liegt möglicherweise daran, dass Menschen solche Wörter anhand von Kontext und persönlicher Erfahrung deuten, während KI-Modelle durchschnittliche, oft widersprüchliche Verwendungen aus ihrem Trainingsdatenmaterial extrahieren und dadurch verzerrte Schätzungen liefern. Zudem zeigte die Studie, dass die KI auf geschlechtsspezifische Sprache und die Sprache des Prompts reagiert: Wechselt das Pronomen von „er“ zu „sie“, werden die Wahrscheinlichkeitseinschätzungen oft strenger – ein Hinweis auf in den Daten verankerte Vorurteile. Auch die Sprache selbst spielt eine Rolle: Übersetzung von Englisch in Chinesisch verändert die Wahrscheinlichkeitseinschätzungen, was auf kulturelle Unterschiede bei der Kommunikation von Unsicherheit hindeutet. Diese Diskrepanz ist kein bloßer sprachlicher Zufall, sondern ein zentrales Problem für die Sicherheit und Akzeptanz von KI. In sensiblen Bereichen wie Gesundheitswesen, Politik oder Wissenschaft kann ein falsch interpretiertes „unwahrscheinlich“ zu fehlerhaften Entscheidungen führen – etwa wenn ein KI-System einem Arzt eine Nebenwirkung als selten einstuft, die das Modell aber mit einer deutlich höheren Wahrscheinlichkeit verbindet. Bisherige Ansätze wie „Chain-of-Thought“-Prompting, bei denen die KI ihre Überlegungen aufzeigen soll, helfen nicht immer, die Kluft zwischen Zahlen und Sprache zu schließen. Die Forschung zeigt, dass KI-Systeme nicht nur das nächste Wort vorhersagen, sondern auch die Bedeutung von Unsicherheit verstehen müssen. Zukünftige Entwicklungen sollten daher robustere Konsistenzmetriken fördern, damit ein 10-prozentiges Risiko immer mit demselben Begriff bezeichnet wird. Nur wenn „wahrscheinlich“ wirklich „wahrscheinlich“ bedeutet, können KI-Systeme zu vertrauenswürdigen Partnern werden – nicht nur zu brillanten Nachahmern menschlicher Sprache. Die Erkenntnisse unterstreichen, dass der Erfolg von KI nicht nur von ihrer Intelligenz, sondern von ihrer kognitiven und kommunikativen Ausrichtung abhängt. Unternehmen wie OpenAI, Google und Meta investieren zunehmend in die Entwicklung verlässlicherer KI-Interaktionen, wobei ethische und kognitive Konsistenz zunehmend im Fokus stehen. Experten fordern mehr Transparenz und Standardisierung, um die menschliche KI-Interaktion zu stabilisieren und Vertrauen aufzubauen.

Verwandte Links

KI und Menschen verstehen „wahrscheinlich“ unterschiedlich – Studie zeigt Kommunikationslücke bei Unsicherheit | Aktuelle Beiträge | HyperAI