HyperAI
Back to Headlines

AI wandert vom Chatbot zum Browser: Neue Tools bieten bessere Web-Interaktion.

vor 3 Tagen

Warum KI von Chatbots zu Browsern wechselt Freitag, der 13. Oktober. Ich bin gerade aus den Urlaub zurück und arbeite mich noch durch alles, was ich verpasst habe. Anscheinend wird der Wechsel von KI-Forschern jetzt wie die Transfergeschäfte in der NBA behandelt. Bevor ich auf das Thema dieser Woche eingehe, möchte ich Sie auf mein Interview mit Perplexity-CEO Aravind Srinivas in Decoder hinweisen. Es ist eine gute tiefgehende Analyse des Hauptthemas dieses Newsletters. Lesen Sie weiter für eine Exklusivmeldung über Substack und weitere Neuigkeiten aus der Welt der KI. Bisher denken die meisten Menschen bei der modernen KI-Booming an Chatbots wie ChatGPT. Nun wird jedoch immer klarer, dass der Webbrowser der nächste Entwicklungsschritt der KI sein wird. Der Grund ist simpel: Die heutigen Chatbots haben keinen Zugang zu Ihrem Online-Leben, wie es Ihr Browser hat. Dieses Maß an Kontext – Lese- und Schreibzugriff auf Ihre E-Mails, Bankkonten, etc. – ist erforderlich, wenn KI ein Werkzeug werden soll, das tatsächlich Aufgaben für Sie erledigt. Zwei kürzliche Produktveröffentlichungen deuten auf diesen Trend hin. Erstens OpenAI’s ChatGPT Agent, der einen einfachen Browser verwendet, um im Internet zu surfen. Zweitens Comet, ein Desktop-Browser von Perplexity, der dies einen Schritt weiterführt, indem er große Sprachmodelle ermöglicht, eingeloggte Sites zu nutzen und Aufgaben für Sie zu erledigen. Es heißt, OpenAI plane selbst einen vollwertigen Browser. Weder ChatGPT Agent noch Comet funktionieren derzeit zuverlässig, und der Zugang zu beiden ist auf teure Abonnementstufen begrenzt, da höhere Rechenkosten für die Betriebsmodelle erforderlich sind. Besonders frustrierend ist, dass beide Produkte Dinge versprechen, die sie nicht tun können, sowohl in Marketingmaterialien als auch in der tatsächlichen Produkterfahrung. ChatGPT Agent ist eine schreibgeschützte Browsererfahrung – es kann keine eingeloggten Sites wie Comet nutzen – und das begrenzt seine Nutzbarkeit stark. Es ist auch sehr langsam. Meine Kollegin Hayden Field bat es, eine bestimmte Lampe auf Etsy zu finden, und ChatGPT Agent brauchte 50 Minuten, um eine Antwort zu geben. Es schaffte es auch nicht, Artikel in ihren Etsy-Warenkorb hinzuzufügen, obwohl es behauptete, es getan zu haben. Obwohl Comet nicht so langsam ist, habe ich mehrere Erfahrungen gemacht, bei denen es behauptete, Aufgaben erledigt zu haben, die es nicht geschafft hatte, oder es sagte, es könne etwas tun, nur um mir sofort daraufhin zu sagen, dass es das nicht könne. Seine Sidecar-Schnittstelle, die den KI-Assistenten rechts neben einer Webseite positioniert, ist ausgezeichnet für schreibgeschützte Aufgaben, wie die Zusammenfassung einer Webseite oder die Recherche zu einem spezifischen Thema, das ich betrachte. Dennoch fühlt sich die gesamte Erfahrung ziemlich brüchig an. Es ist leicht, Zyniker zu sein und zu glauben, dass der aktuelle Zustand von Produkten wie Comet das Beste ist, wozu KI imstande ist, um Aufgaben im Internet zu erledigen. Oder man kann sich die Fortschritte der letzten Jahre im KI-Sektor ansehen und wetten, dass dieser Trend weitergehen wird. In unserem Gespräch dieser Woche sagte Srinivas mir, er setze auf Fortschritte in den Schließen-Modellen, um uns dorthin zu bringen. OpenAI hat ein benutzerdefiniertes Schließen-Modell speziell für ChatGPT Agent entwickelt, das auf komplexeren, mehrstufigen Aufgaben trainiert wurde. (Das Modell hat keinen öffentlichen Namen und ist nicht über eine API verfügbar.) Trotz der vielen Einschränkungen und Fehler, die heute bestehen, hat mich die Verwendung von Comet für einige Tage davon überzeugt, dass das Mainstream-Chatbot-Interface mit dem Browser verschmelzen wird. Es fühlt sich schon wie ein Rückwärtsschritt an, nur einen Chatbot anzusprechen, anstatt eine ChatGPT-ähnliche Erfahrung zu haben, die sehen kann, welche Website ich gerade betrachte. Standalone-Chatbots werden sicherlich nicht verschwinden, insbesondere auf Smartphones, aber der Browser wird die KI freischalten, die sich wirklich wie ein Agent anfühlt. Substacks potenzielle Übernahme: Bevor die Newsletterplattform diese Woche ihre 100 Millionen Dollar Runde ankündigte, berichteten zwei Quellen, dass Shane Smith, Gründer von Vice, Substacks Mitgründer über eine Übernahme des Unternehmens ansprach. Es ist unklar, wie weit diese Verhandlungen fortschritten, aber Smith diskutierte das Konzept auch mit potenziellen finanziellen Förderern. Substacks Führung lehnte sein Übernahmeinteresse ab, schlug ihm aber vor, in die Runde zu investieren, die sie gerade abgeschlossen hatten. Es ist unklar, ob er das tat. Weder Smith noch Substack reagierten auf meine Anfrage um Stellungnahme. Das Ende der "Reverse Acquihires"? Während ich urlaubsbedingt abwesend war, fiel mir die intensive Ablehnung des Windsurf/Google Reverse Acquihires auf. Dieses Muster, bei dem die Gründer einer populären KI-Start-up in die Arme von Big Tech wechseln und das Restteam sich um die Überbrückung kümmern muss, ist nichts Neues. Es ist ein bedauerlicher Nebeneffekt der Antitrust-Untersuchungen gegen Big Tech, die bisher herausgefunden haben, wie sie bekommen können, was sie wollen, indem sie die Hülle eines Start-ups zurücklassen und die Auszahlungen als "Lizenzgebühren" bezeichnen. Angesichts der Art und Weise, wie Cognition die Rettung des restlichen Teams von Windsurf kommunizierte ("jeder einzelne Mitarbeiter wird in dieser Transaktion respektvoll und gut versorgt"), frage ich mich, ob der nächste KI-Start-up-Gründer zweimal nachdenken wird, bevor er sein Team im Stich lässt. Mira Muratis neues KI-Labor wird einen Unternehmensansatz haben. Nachdem ich gesehen habe, wer die Finanziers ihres neuen Labors, Thinking Machines, sind, bin ich mir dessen ziemlich sicher. ServiceNow und Cisco investieren nicht in einen ChatGPT-Konkurrenten. Angesichts des Talents, das sie zusammengetragen hat, wird die Branche genau auf das achten, was das Team in den kommenden Monaten aus dem "multimodalen KI"-Produkt macht. Gibt es Platz für einen weiteren Anthropic-artigen Konkurrenten von OpenAI? Das werden wir bald erfahren. KI-Forscher können keine US-Visa erhalten. NeurIPS, die führende KI-Forschungskonferenz, hat so eine hohe Teilnehmeranzahl für dieses Jahr in San Diego, dass sie einen zweiten Standort in Mexiko hinzugefügt hat, um etwa 500 weitere Personen zu beherbergen. Die Konferenz verkündete, dass es "Schwierigkeiten bei der Erteilung von Reisevisas" für Teilnehmer gebe, die das Hauptereignis in den USA besuchen möchten. Das ist beunruhigend. Einige bemerkenswerte Karrierewechsel: - Zuckerbergs neues Superintelligenz-Labor wird erheblich größer. In dieser Woche traten OpenAI’s Jason Wei und Hyung Won Chung dem Team bei, was bedeutet, dass Meta nun fünf von OpenAI’s 21 "fundamentalen Beitragenden" angezogen hat. - Augustus Odena und Maxwell Nye, die Mitgründer des von Amazon reverse-acquihired Adept AI-Start-ups, das dessen AGI-Labor initiierte, schlossen sich ebenfalls an. - Mark Lee und Tom Gunter von Apple sowie das gesamte Team hinter der Voice-AI-Start-up PlayAI haben offiziell dem Team beigetreten. - Connor Hayes, Leiter des Produkts, wechselte zu Threads, was für alle anderen im breiteren KI-Bereich, die gerade DOGE-ähnliche Interviews mit Alexandr Wangs neuem Team durchlaufen, ein beunruhigendes Signal sein sollte. - Brian Delahunty, Chief Engineer von Anthropic, trat zu Google Cloud, um die Engineering von KI-Agenten zu leiten. - Boris Cherny und Cat Wu kehrten zu Anthropic zurück, nach einer alarmierend kurzen Führungsaufgabe bei Cursor. - Paul Smith verließ ServiceNow, um als erster Chief Commercial Officer bei Anthropic zu arbeiten. - Reddit CMO Roxy Young verließ ihr Unternehmen im Rahmen einer scheinbar größeren Führungskräfte-Neuausrichtung. - Bei Tesla gibt es weitere Personalabgänge: Diesmal betraf es Troy Jones, den Leiter des Vertriebs für Nordamerika. - Andy Byron, CEO von Astronomer, und dessen HR-Chefin Kristin Cabot wurden im Zuge einer internen Untersuchung beurlaubt. Die KI-Industrie erwartet mit Spannung, welche Innovationen und Entwicklungen in den kommenden Monaten auf uns zukommen. Obwohl die aktuellen Produkte wie ChatGPT Agent und Comet noch viele Einschränkungen aufweisen, sind die Perspektiven vielversprechend. Industry-Insider wie Aravind Srinivas sind optimistisch und setzen auf Fortschritte in den Schließen-Modellen. OpenAI und Perplexity sind dabei, bahnbrechende Technologien zu entwickeln, die das Potenzial haben, die Weise zu revolutionieren, wie wir mit KI interagieren.

Related Links