扫描打开手机站
随时逛,更方便!
当前位置:首页 > 智创未来

谷歌Nano Banana Pro发布:打工人高效图像生成新选择

时间:2025-11-21 04:04:08 来源:财联社 作者:财联社

财联社11月21日讯(编辑 史正丞)北京时间周四深夜,全球AI领域迎来重磅更新——谷歌旗下图像生成模型Nano Banana Pro正式登场!作为基于Gemini 3 Pro架构打造的全新工具,这款模型凭借其强大的文本渲染、多语言支持及编辑功能,迅速成为打工人和创意工作者的“效率神器”。

今年8月,谷歌曾推出初代Nano Banana模型,其将人物或动漫照片转化为“3D打印手办”的特效引发全球关注。据谷歌CEO皮查伊披露,该模型上线后,Gemini应用的月活用户数在三个月内从4.5亿飙升至6.5亿,足见其市场影响力。

从“玩趣”到“专业”:Pro版三大核心升级

谷歌官方介绍,Nano Banana Pro在细节表现力、图像分辨率和文本渲染准确性上实现质的飞跃。其核心优势包括:

  • 多语言文本生成:支持简短标语、长段落等不同文本形式,可生成丰富纹理、字体及书法效果,并借助Gemini的多语言推理能力实现实时翻译与本地化;
  • 高分辨率编辑:分辨率从初代的1024X1024提升至最高4K,支持调整相机角度、光线、景深、对焦等参数,并兼容多种纵横比;
  • 角色一致性处理:单次可处理14张图像或5个角色,确保多场景下角色特征统一,尤其适合信息图表与PPT制作。


(照片转化为电影分镜效果,来源:谷歌)


(翻译饮料包装文字,来源:谷歌)

从办公到创作:全场景应用覆盖

Google Labs副总裁Josh Woodward强调,Nano Banana Pro在信息可视化领域表现卓越。例如,用户可通过输入“制作豆蔻茶的步骤”,直接生成带图文说明的分镜流程图。此外,该模型已深度集成至谷歌办公套件Workspace,支持PPT制作、信息图表设计等场景。


(豆蔻茶制作可视化流程,来源:谷歌)

对于创意工作者,Pro版的编辑功能堪称“决策权下放”。用户可自由调整画面焦点、景深及光线效果,甚至通过“角色锁定”功能确保多图生成时人物特征一致。谷歌示例显示,该模型可精准还原同一角色在不同场景下的服装、表情及动作细节。


(多角色一致性处理示例,来源:谷歌)

免费试用与订阅权益:普惠与专业兼顾

谷歌宣布,Nano Banana Pro将逐步在Gemini等应用中开放试用,免费用户可体验基础功能(但有配额限制),而AI Plus、Pro和Ultra订阅用户将获得更高配额。此外,该功能将率先在谷歌AI电影制作工具Flow中向Ultra用户推出,进一步拓展专业创作场景。



(调整画面焦点与角度效果,来源:谷歌)

从“玩趣工具”到“专业助手”,Nano Banana Pro的进化标志着AI图像生成正式进入“精细化控制”时代。无论是快速制作PPT的职场人,还是追求创意表达的艺术家,这款模型都提供了前所未有的效率与自由度。

猜你喜欢