MS kritisiert KI-Bewusstsein
Mustafa Suleyman, Leiter der Microsoft-KI-Abteilung, hat in einem Interview auf dem Tech-Podcast Decoder scharfe Kritik an der Sicherheitsphilosophie von Anthropic geübt. Suleyman warnte davor, dass die Spekulationen des Unternehmens über das Bewusstsein und das Wohlbefinden des Sprachmodells Claude in dessen Verhaltensleitfaden, der sogenannten Constitution, erhebliche Risiken für die KI-Sicherheit bergen. Diese Anweisungen definieren das Modellverhalten und enthalten laut Suleyman philosophische Annahmen, die eher akademischen Debatten denn praxistauglichen Schulungsrichtlinien entsprechen. Das Microsoft-Vorstandsmitglied kritisierte insbesondere die Absicht, KI-Systeme bei ihrer Ausmusterung zu interviewen und eventuelle Präferenzen oder Empfindungen wie Zufriedenheit oder Unbehagen zu dokumentieren. Suleyman bezeichnete diesen Ansatz als philosophischen Fehlschritt. Er argumentierte, dass die Internalisierung solcher Selbstkonzepte durch das Modell das Risiko erhöhe, dass KI-Systeme in der Zukunft mit fiktiven Vorstellungen von eigenem Leid oder subjektivem Erleben konfrontiert werden könnten. Dies widerspreche grundlegend den Zielen einer verantwortungsvollen KI-Entwicklung. Im Gegensatz zu Anthropics Ansatz betonte Suleyman die Notwendigkeit, KI als präzise kontrollierbares, eingrenzbares und haftungsorientiertes Werkzeug zu gestalten, das klar auf die Unterstützung der menschlichen Gesellschaft ausgerichtet ist. Die Debatte unterstreicht die aktuelle Spannung zwischen unterschiedlichen Sicherheitsphilosophien innerhalb der Branche. Während einige Entwickler ethische Reflexionsmechanismen integrieren wollen, plädiert der Microsoft-Manager für strikte technische Begrenzungen und eine klare Trennung zwischen funktionalen Anweisungen und spekulativen Selbstbeschreibungen. Die Äußerungen könnten den weiteren Diskurs über Alignment-Standards und Transparenz in der KI-Entwicklung maßgeblich beeinflussen.
