
Nano Banana 2 代甫一亮相便引发轰动。
上图完全由AI生成,不仅包含网页内容,甚至连浏览器界面和桌面环境也一并生成,且未使用任何参考图像。
这次 Nano Banana 2 以预览版形式短暂现身于第三方平台 Media.io,随后被迅速下架,仅有少数用户得以参与测试。
其展示的能力已远超前代,在处理复杂提示词方面表现卓越,无论是精准的文字渲染、高度逼真的场景还原,还是完整操作系统界面的精细模拟,都达到了前所未有的水平。
然而,谷歌 DeepMind 尚未透露该模型的正式发布时间。

Nano Banana 2 实现全面进化
据测试页面信息,此次发布的 Nano Banana 2 又被称为 GemPix2,主要在真实性、生成速度以及自然交互控制三大方面进行了升级。
从现有测试结果来看,它能生成极其复杂的用户界面(UI),文字渲染几近完美,许多网友初看时都误以为是真实截图。

在遵循物理常识和响应提示细节方面同样表现出色。
它能够同时准确绘制出指针指向特定时间的时钟,并真实呈现一杯满溢红酒的液面张力与玻璃折射效果。

甚至可以生成极为逼真的监控录像画面,不过业内推测正式版本可能会对此类功能进行限制。

此外,Nano Banana 2 还展现出一定的世界知识与逻辑推理能力。
在数学问题的对比测试中,第一代模型虽思路方向大致正确,但最终输出的公式难以辨识;而第二代尽管存在细微错误,整体解题过程却结构清晰,令人印象深刻。

Nano Banana 团队:图像质量已逼近极限
Nano Banana 最早于2025年8月中旬匿名现身AI评测平台LMArena,凭借强大的图像编辑能力迅速登顶排行榜,引发社区热议。
同年8月底,谷歌正式确认其身份为 Gemini 2.5 Flash Image。其代号源于内部项目“香蕉大小的纳米机器人”在图像生成测试中表现出色。

上线不到十天,用户累计编辑图片超过2亿张,为Gemini应用带来超1000万新用户,并一度助其超越ChatGPT,登顶苹果免费应用榜单。

初代 Nano Banana 的核心优势在于强大的图像理解与编辑能力。
支持通过自然语言进行多轮、迭代式修改,并有效解决了AI编辑中的“身份漂移”难题,确保角色特征在多次调整后依然保持一致。

相比早期模型,它新增了多图融合与风格迁移功能,可将多张图片无缝拼接为一张连贯图像,或将某张图的艺术风格迁移到另一张图的主体上,显著提升了电商、广告等领域的创作效率。

同时兼具高速与低成本优势,依托谷歌TPU v5架构优化,平均响应时间仅1.3秒,单张图片生成成本约0.039美元,约为DALL-E 3的十分之一。
此前,Nano Banana 核心团队表示,当前图像生成质量已接近物理上限,未来研发重点将转向提升模型对用户“意图”(intention)的理解能力。
目前,谷歌正加速将 Nano Banana 技术融入其核心产品矩阵。除Gemini应用和AI Studio外,已在Google Photos、搜索(Search)、智能镜头(Lens)及画圈搜索(Circle to Search)中展开集成测试,旨在构建一个无缝衔接的AI视觉体验闭环。
以上就是Nano Banana 2 突然现身!能画公式解数学题,监控画面都能伪造的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号