注:你可以在模型广场筛选查看系统支持的画图模型列表,画图模型基础请求/响应参数结构兼容 OpenAI,同时扩展了一些新的参数来适配其他模型的功能,切换模型时只需修改对应的模型名称即可,若模型请求/响应参数和 OpenAI 不一致,极客智坊底层会自动转换对齐。
响应数据格式和 OpenAI 完全兼容。
平台 | 模型 | 支持的尺寸 |
---|---|---|
OpenAI | GPT-Image-1 | 1024x1024,1024x1536,1536x1024,auto,默认是auto |
Imagen系列 | 无尺寸配置,支持宽高比:1:1、3:4、4:3、9:16、16:9, 默认1:1,HTTP调用只支持默认值。 | |
智谱清言 | CogView系列 | 1024x1024,768x1344,864x1152,1344x768, 1152x864,1440x720,720x1440,默认是1024x1024 |
阿里巴巴 | 通义万相系列 | 图像宽高边长的像素范围为:[768, 1440],单位像素。 可任意组合以设置不同的图像分辨率,最高可达200万像素。 默认值:1024*1024 |
可灵AI | kling系列 | 无尺寸配置,支持宽高比:16:9、9:16、1:1、4:3、3:4、3:2、2:3, 默认1:1 |
即梦AI | 即梦系列 | 支持宽高比及对应尺寸:512x512(默认值)、512x384、384x512、512x341、 341x512、512x288、288x512 |
Stability | Stable Image系列 | 图像宽高边长的像素范围为:[64, 16384],单位像素。 可任意组合以设置不同的图像分辨率,总像素数至少需要达到 4096 像素。 |
Midjourney |
请求/响应参数明细
Authorizations
JWT认证token
Body
application/json
图片生成模型
Example:
"gpt-image-1"
文本提示
Example:
"画一只可爱的小猫"
反向提示词,用来描述不希望在画面中看到的内容,可以对画面进行限制
用于以图生图,支持图片URL/Base64编码,仅图生图模型支持该配置
以图生图引用图片的影响强度,取值范围[0, 1],默认0.5
图片尺寸,不同模型设置不同,详见模型尺寸表
图片宽高比,不同模型设置不同,详见模型尺寸表
图片数量,默认为1
图片质量,可灵AI支持 std、pro 两个配置,OpenAI/智谱清言支持 standard、hd 两个配置,GPT Image支持 auto/low/medium/high 四个配置项
风格预设,目前仅 stable image 支持该配置
Example:
"3d-model"
图片响应格式,支持 url/b64_json 两种格式,默认为url
Available options:
url
, b64_json
图片输出格式,支持 png/jpg/webp 三种格式,默认为png
Available options:
png
, jpg
, webp
图片遮罩,支持图片URL/Base64编码数据
是否添加AI生成水印,默认为false,仅部分模型支持
背景透明度
是否异步生成,默认false,即同步等待图片生成成功后返回生成结果,如果异步需要通过调用图片获取接口获取生成结果
自动重试次数,默认0,表示失败不重试