HyperAIHyperAI

Command Palette

Search for a command to run...

Gemini Omni 与 Gemini 3.5 11 大功能演示

在 2026 年谷歌 I/O 开发者大会上,谷歌正式发布了最新一代人工智能模型系列:Gemini Omni 与 Gemini 3.5 家族。其中,Gemini Omni 是一款具备多模态生成能力的新模型,支持从图像、音频、视频和文本等多种输入中生成高质量视频。该模型基于谷歌对现实世界的理解,不仅能创作内容,还允许用户通过自然语言对话轻松编辑视频。其核心优势在于能保持角色一致性、物理规律合理以及场景记忆连贯,使得用户只需输入指令,即可在原有视频基础上进行局部或整体的创造性改造,实现传统拍摄无法完成的场景。 与此同时,谷歌推出了 Gemini 3.5 系列模型,旨在将前沿智能与实际行动能力相结合,构建更具自主性的智能代理。该系列首发型号为 Gemini 3.5 Flash,专为提升智能体性能和代码开发能力而设计。它在处理复杂、长周期的任务方面表现卓越,能够直接解决具有实际应用场景的问题,标志着向真正实用化智能代理迈出了重要一步。 为了直观展示这两款新模型的能力,谷歌在发布会现场演示了 11 个实际应用场景。这些演示涵盖了从创意视频编辑到复杂任务执行等多个维度,充分展现了 Gemini Omni 在多模态内容创作上的突破性进展,以及 Gemini 3.5 在自动化与智能化领域的强大实力。此次发布不仅丰富了谷歌的 AI 产品矩阵,也为开发者提供了更强大的工具,推动生成式 AI 向更深层次的应用场景拓展。

相关链接