AI生成圖片文字不再是亂碼!Google推Nano Banana Pro文字呈現大進化

Google正式发表全新的AI图像生成模型「Nano Banana Pro」,标榜其为目前旗下最擅长生成文字内容的图像模型,多语言文字也能呈现清晰、正确且可阅读的字体。(图/翻摄自Google DeepMind频道)

Google正式发表全新的AI图像生成模型「Nano Banana Pro」,这是今年推出的Nano Banana升级版本,标榜以最新、最强大的Gemini 3 Pro模型作为核心。Google表示,Nano Banana Pro是目前旗下最擅长生成文字内容的图像模型,不论是标语、完整段落,甚至多语言文字,都能呈现清晰、正确且可阅读的字体。

许多AI生成图片时,在文字方面往往会制作成乱码,或者根本不存在的文字,不过根据外媒「MacRumors」报导,Google最新推出的Nano Banana Pro在产生海报、模型示意图等内容时,能支援更多种字体、材质与文字风格。Google强调,新模型也更适合制作需要大量资讯的素材,例如资讯图表或教学示意图。使用者可让模型连结Google搜寻,取得即时资料并融入生成的图像中,呈现比以往更丰富的内容。

Google正式发表全新的AI图像生成模型「Nano Banana Pro」,标榜其为目前旗下最擅长生成文字内容的图像模型,多语言文字也能呈现清晰、正确且可阅读的字体。(Google提供)

Google正式发表全新的AI图像生成模型「Nano Banana Pro」,标榜其为目前旗下最擅长生成文字内容的图像模型,多语言文字也能呈现清晰、正确且可阅读的字体。(Google提供)

Google也表示,Nano Banana Pro提升了图像的一致性处理能力,使用者最多可上传 14 张图片,并能让模型维持多达五个人物外貌的一致性,这对需要制作多张风格统一的素材相当有用;而在图像编辑方面,Nano Banana Pro提供更精细的局部编辑功能,让使用者能针对特定区域进行调整,包括变更视角、焦距、色彩与光线效果等,并支援最高4K的图像输出品质。

随着Nano Banana Pro上线,Google也为Gemini加入辨识AI生成影像的能力。所有Google AI生成的图片都会嵌入SynthID辨识资讯,且免费与AI Pro方案用户生成的图片会显示可见浮水印,以便识别到底是否为AI生成。

Google正式发表全新的AI图像生成模型「Nano Banana Pro」,标榜其为目前旗下最擅长生成文字内容的图像模型,多语言文字也能呈现清晰、正确且可阅读的字体。(Google提供)

Google正式发表全新的AI图像生成模型「Nano Banana Pro」,标榜其为目前旗下最擅长生成文字内容的图像模型,多语言文字也能呈现清晰、正确且可阅读的字体。(Google提供)