跳转到主要内容
Gemini-2.5-Flash-Image 聚合了 Gemini-2.5-Flash 的推理能力和 Nano Banana 模型的画图能力,从而实现在多轮对话中进行图片创作和修改。

模型参数

  • 模型ID:gemini-2.5-flash-image
  • 模型价格:你可以在模型广场查看最新价格信息(Gemini-2.5-Flash-Image 的价格不区分图片尺寸和质量,统一按每张图片计费)
  • 模型参数:参考对话 API 手册
  • API认证:获取 API KEY
为保持向前兼容,你也可以通过 gemini-2.5-flash-image-preview 来调用该模型,二者完全等价,但是考虑到未来维护和稳定性,建议切到 gemini-2.5-flash-image 这个稳定版进行调用。
由于是对话模型,Gemini-2.5-Flash-Image 不支持通过参数对生成图片进行控制,所有图片生成和修改以及对图片属性的设置均通过 prompt 调优来实现。以下策略将帮助你创建有效的提示词,从而精确生成你想要的图像:

图像生成

掌握 Gemini 2.5 Flash 图像生成的首要原则是:
**请描述场景,而不仅仅是罗列关键词。**模型的核心优势在于其深入的语言理解能力。通常来说,一个具有叙述性和描述性的段落会比一堆不相关的词语列表生成更好、更连贯的图像。
1. 照片级真实场景 要生成逼真的图像,请使用摄影术语,提及相机角度、镜头类型、光线照明和细节,以引导模型生成照片级真实感的效果。
一张照片写实风格的[镜头类型],展现[主体],[动作或表情],场景设置在[环境]中。
场景由[光线描述]照亮,营造出[氛围]的气氛。使用[相机/镜头细节]拍摄,强调[关键纹理和细节]。
图像应采用[宽高比]格式。
2. 风格化插图与贴纸 要创建贴纸、图标或其他素材,请明确说明风格需求,并要求透明背景。
一个[风格]贴纸,主体是[主题],特色是[关键特征]和[色彩搭配]。
设计应该采用[线条风格]和[阴影风格]。背景必须是透明的。
3. 图像中的准确文字 Gemini 在文本渲染方面表现出色。请清晰说明文本内容、字体样式(需详细描述)以及整体设计。
为[品牌/概念]创建一个[图像类型],包含文字"[要渲染的文字]",采用[字体风格]。
设计应该是[风格描述],配色方案为[色彩方案]。
4. 产品模型与商业摄影 非常适合为电子商务、广告或品牌打造干净、专业的产品图片。
一张高分辨率、影棚打光的产品摄影照片,展现[产品描述],摆放在[背景表面/描述]上。
光线设置为[光线布局,例如:三点柔光箱布局],目的是[光线用途]。相机角度是[角度类型],以展示[特定特征]。
超写实风格,尖锐对焦在[关键细节]上。[宽高比]。
5. 极简主义与留白设计 非常适合为网站、演示文稿或营销材料创建背景,以便在其上添加文字内容。
一个极简主义构图,特色是单个[主体]位于画面的[右下角/左上角/等位置]。
背景是一大片空旷的[颜色]画布,创造出显著的负空间。柔和、微妙的光线。[宽高比]。
6. 漫画画面/分镜故事板 基于角色一致性和场景描述,为视觉叙事创建画面。
一个单独的漫画面板,采用[艺术风格]风格。在前景中,[角色描述和动作]。在背景中,[场景细节]。
面板有一个[对话框/说明框],文字内容是"[文字]"。光线营造出[氛围]的情绪。[宽高比]。

图像编辑

以下示例展示了如何将图像与您的文本提示结合使用,以实现编辑、构图和风格转换的效果。 1. 添加和删除元素 提供一张图片并描述您想要的修改。模型将保持原始图片的风格、光线和透视角度。
使用提供的[主体]图像,请[添加/移除/修改][元素]到/从场景中。确保变化是[对变化应如何融合的描述]。
2. 图像修复 通过对话方式定义一个”掩码”,用于编辑图像的特定部分,同时保持图像的其他部分不变。
使用提供的图像,仅将[特定元素]更改为[新元素/描述]。保持图像中的其他所有内容完全相同,保留原始风格、光照和构图。
3. 风格迁移 提供一张图片,并让模型以不同的艺术风格重新创作其内容。
将提供的[主题]照片转换为[艺术家/艺术风格]的艺术风格。保留原始构图,但使用[风格元素描述]进行渲染。
4. 高级构图技术:组合多张图像 提供多张图片作为参考,创建新的合成场景。这非常适合制作产品效果图或创意拼贴画。
通过组合提供图像中的元素来创建新图像。取出[图像1中的元素]并将其放置在[图像2中的元素]上/与其一起。最终图像应该是[最终场景的描述]。
5. 高保真细节保持 为确保编辑过程中关键细节(如面部或标志)能够得到保留,请在提出编辑请求时对其进行详细描述。
使用提供的图像,将[图像2中的元素]放置到[图像1中的元素]上。确保[图像1中的元素]的特征保持完全不变。
添加的元素应该[元素如何融合的描述]。
I