HyperAI

Die KI-Branche durchläuft einen deutlichen Paradigmenwechsel. Während die Ära der Large Language Models noch immer durch massive Investitionen geprägt ist, konzentrieren sich führende Forscher und Startups zunehmend auf sogenannte World Models. Diese Systeme sollen künstliche Intelligenz nicht nur auf die Verarbeitung von Texten und Bildern beschränken, sondern ihr ein tiefgreifendes Verständnis von Raum, Zeit und physikalischen Gesetzmäßigkeiten vermitteln. Computerwissenschaftler wie Fei-Fei Li von World Labs in San Francisco und Yann LeCun, der Meta verließ, um das Pariser Institut Advanced Machine Intelligence Labs zu gründen, sehen in dieser Entwicklung den entscheidenden Schritt hin zu einer Intelligenz, die auf die eigenen Interaktionen mit der Umwelt reagieren kann. Die Begrenzungen reiner Text- und Bildgeneratoren werden dabei offensichtlicher. Martin Hebert, Dekan der Informatik an der Carnegie Mellon University, weist darauf hin, dass das Vorhersagen des nächsten Tokens oder Pixels zwar kreative und administrative Aufgaben automatisiert, jedoch keine räumliche Geometrie oder physikalische Interaktionen abdeckt. Im Gegensatz dazu lernen World Models die statistische Struktur von Umwelt und Physik. Dies bildet die Grundlage für das sogenannte Physical AI, das als evolutionärer Nachfolger der klassischen Robotik gilt. Ähnlich wie das menschliche Nervensystem grundlegende Bewegungsmuster adaptiert, sollen solche Modelle Maschinen ermöglichen, sich schnell an veränderte physische Bedingungen anzupassen. Zahlreiche Startups arbeiten bereits an konkreten Umsetzungen. Louis Castricato, der zuvor an der Brown University an Sprachmodellen forschte, gründete in Rhode Island das Unternehmen Overworld, das dynamische Simulationen für Videospiele entwickelt, in denen virtuelle Umgebungen auf reale Interaktionen reagieren. Darüber hinaus investieren Venture-Capital-Firmen wie Kindred Ventures gezielt in diesen Sektor. Portfolio-Unternehmen reichen von Causal Labs, das World Models für Wettervorhersagen einsetzt, bis hin zu Extropic, das auf diese Architektur optimierte Halbleiter herstellt. Steve Jang von Kindred Ventures betont, dass die Zukunft der KI in einer Vielfalt spezialisierter Modelle liegen wird, nicht in einem einzigen universellen System. Um die begriffliche Vielfalt einzuordnen, schlägt Fei-Fei Li eine Klassifizierung vor. Sie unterscheidet zwischen Renderern, die primär auf visuelle Qualität abzielen, Simulatoren, die physikalische Strukturen realistisch abbilden, und Planern, die Entscheidungen von Agenten in unstrukturierten Umgebungen prognostizieren. Besonders Planer gelten als Schlüsselelement für den Einsatz von Robotern in der Praxis. Die Branche befindet sich in einem intensiven Wettlauf, um zuverlässige, planende Systeme zu entwickeln, die KI aus der digitalen Sphäre in die physische Welt überführen. Mit dieser Entwicklung verschiebt sich der Fokus von rein generativer Software hin zu autonomen Systemen, die in realen Ökosystemen operieren können.

Verwandte Links

Verwandte Links

Verwandte Links

4-stufige Bildausgabe/4K-Qualität/6-fache Beschleunigung, PiD Verwendet Pixeldiffusion Zur Vereinheitlichung Von Dekodierung Und Superauflösungsausgabe; SA-3DAO: Ein Datensatz Mit 1000 Paaren Realer Bilder, Die Mit Von Künstlern Handgefertigten 3D-Netzen Gepaart sind.

4-stufige Bildausgabe/4K-Qualität/6-fache Beschleunigung, PiD Verwendet Pixeldiffusion Zur Vereinheitlichung Von Dekodierung Und Superauflösungsausgabe; SA-3DAO: Ein Datensatz Mit 1000 Paaren Realer Bilder, Die Mit Von Künstlern Handgefertigten 3D-Netzen Gepaart sind.

Command Palette

Tech-Startups bauen „Physische KI“ für Roboter

Verwandte Links

Command Palette

Tech-Startups bauen „Physische KI“ für Roboter

Verwandte Links

Command Palette

Tech-Startups bauen „Physische KI“ für Roboter

Verwandte Links

4-stufige Bildausgabe/4K-Qualität/6-fache Beschleunigung, PiD Verwendet Pixeldiffusion Zur Vereinheitlichung Von Dekodierung Und Superauflösungsausgabe; SA-3DAO: Ein Datensatz Mit 1000 Paaren Realer Bilder, Die Mit Von Künstlern Handgefertigten 3D-Netzen Gepaart sind.

4-stufige Bildausgabe/4K-Qualität/6-fache Beschleunigung, PiD Verwendet Pixeldiffusion Zur Vereinheitlichung Von Dekodierung Und Superauflösungsausgabe; SA-3DAO: Ein Datensatz Mit 1000 Paaren Realer Bilder, Die Mit Von Künstlern Handgefertigten 3D-Netzen Gepaart sind.