ChatGPT-Agent fordert volle Kontrolle über Ihren PC
OpenAI ist dabei, den Chatbot-Textboxen den Rücken zu kehren und seine künstliche Intelligenz in jeden Winkel der Geräte der Nutzer einzubinden. Am Donnerstag stellte das Unternehmen ChatGPT Agent vor, eine neue Entwicklung im Bereich der „agenterischen“ Technologie, die es KI-Modellen ermöglicht, spezifische Aufgaben von Anfang bis Ende selbstständig zu erledigen. ChatGPT Agent verwendet dazu eine virtuelle Computerumgebung, um Anfragen zu bearbeiten. Beispiele für mögliche Aufgaben sind der Überblick über bevorstehende Kundentermine auf Basis des Kalenders und aktueller Nachrichten, das Planen und Einkaufen von Zutaten für ein japanisches Frühstück für vier Personen oder die Analyse von Konkurrenten und das Erstellen einer Präsentation. Die Verantwortlichen hinter ChatGPT Agent sind Yash Kumar, Produktleiter, und Isa Fulford, Forschungsleiterin. Das Team, das aus 20 bis 35 Mitarbeitern besteht, hat das Modell speziell für diesen Zweck entwickelt, indem es die Fähigkeiten von zwei bestehenden Tools, Operator und Deep Research, kombiniert. Operator kann Webbrowser bedienen, während Deep Research komplexe, mehrstufige Forschungs- und Analysenaufgaben durchführt. Das neue Modell wurde durch Verstärkungslernen trainiert, um Aufgaben zu bewältigen, die mehrere Werkzeuge erfordern, wie z.B. den Wechsel zwischen Browser und Terminal. In einer Demo zeigten Kumar und Fulford, wie ChatGPT Agent verschiedene Aufgaben erledigen kann. Zum Beispiel kann es Google Calendar abfragen, um einen passenden Termin für ein Date zu finden, und dann bei OpenTable nach geeigneten Restaurants suchen. Es kann auch einen Forschungsbericht über den Vergleich von Labubus und Beanie Babies erstellen. Fulford erwähnte, dass sie das Tool bereits für Online-Shopping genutzt hat, weil die Kombination der Technologien hinter Deep Research und Operator besser funktioniert als jeder dieser Tools alleine. Kumar berichtete, dass er ChatGPT Agent verwendet, um kleinere Aufgaben seines Alltags zu automatisieren, wie die wöchentliche Anfrage eines Parkplatzes am Arbeitsplatz. Obwohl ChatGPT Agent in der Lage ist, komplexe Aufgaben zu bewältigen, kann es langsam sein, was die Latenz betrifft. Kumar sagte, dass das Team eher darauf fokussiert ist, schwierige Aufgaben effizient zu lösen, anstatt die Geschwindigkeit zu optimieren. Selbst wenn eine Aufgabe 15 oder 30 Minuten dauert, sei das immer noch schneller als die manuelle Bearbeitung, argumentierte Fulford. Bevor das Tool etwas „unwiderbringliches“ tut, wie z.B. eine E-Mail zu senden oder eine Reservierung zu tätigen, bittet es um Zustimmung. Finanzielle Transaktionen werden derzeit eingeschränkt, und es gibt eine zusätzliche Schutzfunktion, die „Watch Mode“ genannt wird, die verhindert, dass das Tool arbeitet, wenn der Nutzer von einer bestimmten Kategorie von Webseiten wegnavigiert. ChatGPT Agent wird zunächst den Nutzern von ChatGPT Pro, Plus und Team zur Verfügung stehen. Später im Sommer sollen auch Nutzer von ChatGPT Enterprise und Education Zugang erhalten. Es gibt jedoch noch kein genaues Rollout-Datum für die Europäische Wirtschaftszone und die Schweiz. Der Begriff „AI-Agent“ ist seit Jahren ein vielbesprochener Trend in der Branche. Entwickler streben nach einem Tool, das类似Iron Man's J.A.R.V.I.S., spezifische Arbeitsfunktionen übernehmen, Termine im Kalender prüfen oder Geschenke basierend auf den Vorlieben eines Freundes kaufen kann. Der Trend gewann 2023 an Popularität, insbesondere nachdem Klarna im Februar 2024 bekannt gab, dass sein eigener AI-Agent innerhalb eines Monats zwei Drittel seiner Kundendienst-Chats bearbeitet hatte – das entspricht der Arbeit von 700 Vollzeitbeschäftigten. Seitdem haben Top-Manager von Amazon, Meta, Google und anderen Unternehmen ihre AI-Agent-Ziele in Gewinn prognostizierenden Telefonkonferenzen immer häufiger erwähnt. Google hat letzte Woche Windsurfs CEO, Co-Gründer und einige Mitglieder des Forschungs- und Entwicklungs-Teams eingestellt, um seine agenterischen AI-Projekte weiter voranzubringen. OpenAI selbst hat im Januar den Operator vorgestellt, ein Tool, das auf der Web-Oberfläche Aufgaben erledigen kann. Anthropic, das von Amazon unterstützte AI-Startup hinter Claude, hat im Oktober ein ähnliches Tool namens „Computer Use“ veröffentlicht, das ebenfalls dazu dient, Aufgaben auf einem Computer wie ein Mensch zu erledigen. Mehrere AI-Unternehmen, darunter OpenAI, Google und Perplexity, bieten außerdem ein AI-Tool an, das als „Deep Research“ bezeichnet wird und große Analysen und Forschungsberichte zu beliebigen Themen erstellen kann. Die Einführung von ChatGPT Agent unterstreicht OpenAIs Engagement in der Entwicklung von AI-Tools, die das tägliche Leben der Nutzer vereinfachen und effizienter gestalten sollen. Obwohl das Tool noch Verbesserungen braucht, insbesondere in Bezug auf die Geschwindigkeit, zeigt es einen wichtigen Schritt in Richtung der Integration von agenterischer KI in alltägliche Aufgaben. Die Reaktionen der Branche und der Nutzer deuten darauf hin, dass der Trend zu AI-Agents weiterhin an Dynamik gewinnen wird, während Unternehmen darum bemüht sind, die technologischen Grenzen zu überschreiten und verlässliche, hilfreiche Tools zu schaffen. Klarna, zum Beispiel, musste seine KI-Agent-Lösung zurückziehen, da die Qualität der Leistungen nicht den Erwartungen entsprach. Dies verdeutlicht die Herausforderungen, die Unternehmen bei der Entwicklung solcher Tools bewältigen müssen. Trotzdem sind die Aussichten positiv, da die Nachfrage nach effizienten und autonomen AI-Agents in der Unternehmenswelt und im Alltag zunimmt. OpenAI und andere führende Player in der Branche setzen große Hoffnungen auf diese Technologie, um das Potenzial der KI voll auszuschöpfen und die Nutzerzufriedenheit zu steigern.