HyperAIHyperAI

Command Palette

Search for a command to run...

Gemini 3实测表现惊人,与谷歌宣称几乎完全一致

谷歌新推出的Gemini 3系列AI模型,尤其是旗舰版Gemini 3 Pro,被寄予厚望,宣称在推理能力、代码生成、多模态处理和“代理式”任务执行方面实现重大升级。经过实际测试,其表现基本符合宣传水平,但仍有明显局限。 在核心功能测试中,Gemini 3成功生成了一个交互式3D可视化模型,展示从亚原子粒子到宇宙网的尺度对比,结构准确,能自由缩放浏览,基本还原了谷歌演示中的效果。不过,部分3D模型如DNA链和沙滩球的渲染质量较低,色彩暗淡,细节不足,与官方演示存在差距。 在更简单的任务中,如生成体素风格的鹰和熊猫,结果虽大致正确,但存在明显缺陷:鹰缺少眼睛,树无树干,而普通3D模型的penguin和turtle则显得粗糙,缺乏细节。这表明其在复杂图形生成上仍不够稳定。 Gemini 3还测试了“生成式UI”功能,为Pro用户打造类似杂志的视觉化界面。在规划罗马三日游的测试中,它生成了包含行程、可选偏好(如轻松或紧凑行程、餐饮类型)的互动网页,用户可自定义后实时更新布局。该功能在规划旅行、组装电脑或设置水族箱等场景中具有实用潜力。 在“Gemini Agent”任务代理功能测试中,模型能分析近100封未读邮件,分类为重要事项、账单和促销信息,并提供一键提醒、归档或退订建议。它成功将账单提醒添加至Google Tasks,甚至尝试进入支付界面,但因安全限制被中断。虽然效率不如手动操作,但能发现被忽略的邮件,有一定辅助价值。 尽管Gemini在Gmail集成上优于Perplexity和ChatGPT,能直接操作邮件,但在发送邮件速度上反而更慢。在尝试预订餐厅时,模型误报“预订费用”,反复确认,最后才澄清为服务费,过程繁琐,实际效率不如手动操作。 总体来看,Gemini 3 Pro在交互式可视化和多模态任务上表现亮眼,尤其适合创意设计、教学演示等场景。但其在图形质量、任务执行流畅度和安全性控制上仍有提升空间。目前,对于日常信息查询,其文本回答已足够可靠,仍以传统问答方式使用最为高效。

相关链接