Gemini应用升级:AI图像识别与生成能力全面增强
谷歌宣布推出一系列新功能,以应对生成式AI内容日益普及带来的真实性挑战。从即日起,用户可通过Gemini应用直接验证图片是否由Google AI生成或编辑,这一功能依托于其自主研发的SynthID数字水印技术。该技术自2023年推出以来,已为超过200亿件AI生成内容嵌入了不可见的信号,帮助识别内容来源。 当用户在Gemini中看到一张图片并想确认其是否由Google AI生成时,只需上传图片并提问:“这张图是用Google AI生成的吗?”或“这是AI生成的吗?”,Gemini将自动检测SynthID水印,并结合自身推理能力提供详细说明,增强用户对网络内容的判断力。 此次更新是谷歌长期致力于提升信息透明度的延续。此前,谷歌已在Google搜索中提供图像背景信息,并推出DeepMind研发的Backstory功能。未来,SynthID验证能力将扩展至视频和音频等更多媒体格式,并逐步接入Google Search、YouTube、Pixel手机和Google相册等更多产品平台。 与此同时,谷歌正积极参与行业协作,通过其在内容真实性与溯源联盟(C2PA)的领导角色,推动跨平台内容透明标准。本周起,Gemini 3 Pro图像生成模型(Nano Banana Pro)在Gemini应用、Vertex AI及Google Ads中生成的图片,将自动嵌入C2PA元数据,进一步明确内容创作过程。未来,谷歌还将支持C2PA内容凭证,使用户能够追溯非谷歌生态内生成内容的原始来源。 此外,Gemini 3版本也带来多项升级:推理能力显著提升,支持更精准的“氛围编程”(vibe coding),界面焕然一新,并推出实验性AI代理(Gemini Agent),可自动处理日程安排、租车等琐事。用户现在还能使用Nano Banana Pro融合图像、设计海报、创建图表,并一键适配不同平台尺寸。Veo 3.1视频生成模型支持多参考图输入,实现对角色、物体、风格和场景的精准控制。Gemini Live也新增多语言切换、语速与语调调节,甚至可角色扮演式回应。 为支持教育领域,谷歌还将美国大学生的免费Google AI Pro服务延长一年,确保其持续使用Gemini 3等先进AI功能。 谷歌强调,这些举措是其推动“大胆而负责任的AI”承诺的重要组成部分,旨在构建一个更可信、可追溯的数字内容生态。
