gemini-2.0-flash-exp-image-generation
、gpt-4o-image
、midjourney-chat
三个模型支持在多轮对话中绘制图像,以下是通过对话画图的请求示例,和普通文本对话并无不同:
gpt-4o-image
、midjourney-chat
支持流式输出,gemini-2.0-flash-exp-image-generation
不支持流式输出。图片生成完成后,返回的 content
字段中会包含生成的图片 URL 地址,你可以通过正则进行提取,或者直接在支持 Markdown 渲染的组件中显示。
image_url
字段的 url
属性可以是任何有效的图片 URL 地址或者 Base64 编码的图片数据。
gpt-4o
以外的更多模型以及更丰富的参数设置,关于如何在 Response API 中进行图像生成和编辑,请参考Response API 画图文档。