HyperAI

Im August stellten wir Genie 3 vor, ein allgemeines Weltmodell, das in der Lage ist, vielfältige und interaktive Umgebungen zu generieren. Bereits in dieser frühen Phase konnten vertrauenswürdige Tester beeindruckende Welten und Erlebnisse erschaffen und dabei völlig neue Anwendungsmöglichkeiten entdecken. Der nächste Schritt besteht nun darin, den Zugang zu einem speziellen, interaktiven Prototypen zu erweitern, der sich auf die immersive Weltgestaltung konzentriert. Ab heute wird der experimentelle Forschungsprototyp „Project Genie“ für Google AI Ultra-Abonnenten in den USA (18+) schrittweise freigegeben. Dieses Prototyp-Web-App ermöglicht es Nutzern, eigene interaktive Welten zu erstellen, zu erkunden und neu zu gestalten. Ein Weltmodell simuliert die Dynamik einer Umgebung und prognostiziert, wie sich diese im Laufe der Zeit verändert und wie Aktionen sie beeinflussen. Während Google DeepMind bereits Agenten für spezifische Umgebungen wie Schach oder Go entwickelt hat, ist die Entwicklung einer AGI (allgemeinen künstlichen Intelligenz) auf Systeme angewiesen, die die Vielfalt der realen Welt bewältigen können. Um diesem Ziel näherzukommen, haben wir Genie 3 entwickelt. Im Gegensatz zu statischen 3D-Szenen, die nur einen Moment einfrieren, generiert Genie 3 die Zukunft der Welt in Echtzeit, während der Nutzer sich bewegt und mit der Umgebung interagiert. Es simuliert Physik und Wechselwirkungen in dynamischen Welten und erreicht durch bahnbrechende Konsistenz die Fähigkeit, praktisch jede realweltliche Situation nachzubilden – von der Robotik über Animation und fiktive Geschichten bis hin zu historischen Orten und Reiseerlebnissen. Project Genie basiert auf Genie 3, Nano Banana Pro und Gemini und ist ein Web-App-Prototyp, der Nutzern die Möglichkeit bietet, die immersiven Erlebnisse unseres Weltmodells direkt auszuprobieren. Das Erlebnis zentriert sich auf drei Kernfunktionen: Weltgenerierung, Exploration und Remixing. Die Nutzer können Welten in 60-Sekunden-Intervallen erstellen, wobei die Erstellung und Interaktion durch die KI gesteuert wird. Die Technologie ermöglicht eine kontinuierliche, konsistente Simulation, die auf die Bedürfnisse von Forschung und kreativer Medienproduktion abgestimmt ist. Da Genie 3 ein frühes Forschungsmodell ist, gibt es noch einige Einschränkungen. Beispielsweise fehlen noch Funktionen wie promptbasierte Ereignisse, die die Welt während der Exploration verändern. Diese werden in zukünftigen Updates hinzugefügt. Die Entwicklung erfolgt verantwortungsbewusst, wie es für unsere Mission zur Entwicklung von AGI erforderlich ist. Durch die Zusammenarbeit mit vertrauenswürdigen Testern aus verschiedenen Branchen und Disziplinen haben wir wertvolle Erkenntnisse gewonnen, die nun in diesem Prototyp umgesetzt werden. Project Genie ist ein Experiment im Google Labs und dient der Forschung. Der Zugang beginnt zunächst mit Google AI Ultra-Abonnenten in den USA und wird in Zukunft auf weitere Regionen ausgeweitet. Wir freuen uns darauf, die unendlich vielfältigen Welten zu sehen, die die Nutzer erschaffen werden. Langfristig ist das Ziel, diese Technologie und Erlebnisse für eine breitere Nutzerbasis zugänglich zu machen.

Verwandte Links

Verwandte Links

Verwandte Links

ByteDance Veröffentlicht Lance Als Open Source, Ein 3B-Modell, Das Verstehen, Generieren Und Bearbeiten Umfasst; Die National University of Singapore Schlägt Den ViMU-Datensatz Vor: Er Umfasst 588 Videos Und Nonverbale Fragebeantwortung.

ByteDance Veröffentlicht Lance Als Open Source, Ein 3B-Modell, Das Verstehen, Generieren Und Bearbeiten Umfasst; Die National University of Singapore Schlägt Den ViMU-Datensatz Vor: Er Umfasst 588 Videos Und Nonverbale Fragebeantwortung.

Command Palette

Google Project Genie: Interaktive Welten aus Foto oder Prompt

Verwandte Links

Command Palette

Google Project Genie: Interaktive Welten aus Foto oder Prompt

Verwandte Links

Command Palette

Google Project Genie: Interaktive Welten aus Foto oder Prompt

Verwandte Links

ByteDance Veröffentlicht Lance Als Open Source, Ein 3B-Modell, Das Verstehen, Generieren Und Bearbeiten Umfasst; Die National University of Singapore Schlägt Den ViMU-Datensatz Vor: Er Umfasst 588 Videos Und Nonverbale Fragebeantwortung.

ByteDance Veröffentlicht Lance Als Open Source, Ein 3B-Modell, Das Verstehen, Generieren Und Bearbeiten Umfasst; Die National University of Singapore Schlägt Den ViMU-Datensatz Vor: Er Umfasst 588 Videos Und Nonverbale Fragebeantwortung.