财联社11月20日消息,谷歌公司于今日正式推出全新一代尖端图像生成与编辑模型——NANO BANANA PRO(内部代号Gemini 3 Pro图像)。该模型在图像清晰度与多语言文本处理能力方面实现重大突破,标志着谷歌在AI图像生成领域的技术迭代进入新阶段。
据谷歌官方披露,NANO BANANA PRO通过优化深度学习架构,显著提升了生成图像的分辨率与细节表现力。其核心优势体现在两大方面:其一,模型可生成分辨率更高、边缘更锐利的图像,在复杂场景还原与微观细节呈现上达到行业领先水平;其二,支持多语言(含中文、英文、西班牙语等)的精准文本嵌入,生成的文字内容不仅清晰可读,且与图像主题高度契合,解决了传统模型在跨语言场景下的语义偏差问题。
行业分析师指出,NANO BANANA PRO的推出将重塑图像生成工具的市场格局。其多语言支持能力尤其适用于全球化内容创作场景,如跨境电商产品图生成、跨国广告素材制作等。目前谷歌尚未公布该模型的商业化时间表,但技术社区已对其在医疗影像、教育素材等垂直领域的应用展开讨论。
此次发布延续了谷歌在生成式AI领域的快速迭代策略。自2023年初发布Gemini系列基础模型以来,谷歌已陆续推出面向文本、代码、语音等场景的专用版本,NANO BANANA PRO的落地标志着其多模态技术矩阵进一步完善。