绘制图片
基于文本提示生成AI图片的接口,支持多种图片生成模型和参数配置
注:你可以在模型广场筛选查看系统支持的画图模型列表,画图模型基础请求/响应参数结构兼容 OpenAI,同时扩展了一些新的参数来适配其他模型的功能,切换模型时只需修改对应的模型名称即可,若模型请求/响应参数和 OpenAI 不一致,极客智坊底层会自动转换对齐。 响应数据格式和 OpenAI 完全兼容。
不同AI平台的画图模型支持的尺寸不一样,具体支持的尺寸请参考下面的表格:
平台 | 模型 | 支持的尺寸 |
---|---|---|
OpenAI | DALL·E 3 | 1024x1024,1792x1024,1024x1792,默认是1024x1024 |
智谱清言 | CogView系列 | 1024x1024,768x1344,864x1152,1344x768, 1152x864,1440x720,720x1440,默认是1024x1024 |
Imagen 3 | 无尺寸配置,支持宽高比:1:1、3:4、4:3、9:16、16:9, 默认1:1,HTTP调用只支持默认值。 | |
阿里巴巴 | 通义万相2.1系列 | 图像宽高边长的像素范围为:[768, 1440],单位像素。 可任意组合以设置不同的图像分辨率,最高可达200万像素。 默认值:1024*1024 |
可灵AI | kling-v1系列 | 无尺寸配置,支持宽高比:16:9、9:16、1:1、4:3、3:4、3:2、2:3, 默认1:1 |
Stability | Stable Image系列 | 图像宽高边长的像素范围为:[64, 16384],单位像素。 可任意组合以设置不同的图像分辨率,总像素数至少需要达到 4096 像素。 |
画图模型 API 调用示例可以参考这里:生成图像。
请求/响应参数明细
Authorizations
JWT认证token
Body
图片生成模型
"dall-e-3"
文本提示
"画一只可爱的小猫"
反向提示词,用来描述不希望在画面中看到的内容,可以对画面进行限制
用于以图生图,支持图片URL/Base64编码,目前仅可灵AI支持该配置
以图生图引用图片的影响强度,取值范围[0, 1],默认0.5
图片尺寸,不同模型设置不同,详见模型尺寸表
"1024x1024"
图片宽高比,不同模型设置不同,详见模型尺寸表
"1:1"
图片数量,默认为1
1
图片质量,可灵AI支持 std、pro 两个配置,OpenAI/智谱清言支持 standard、hd 两个配置,GPT Image支持 auto/low/medium/high 四个配置项
"hd"
风格预设,目前仅 stable image 支持该配置
"3d-model"
图片响应格式,支持 url/b64_json 两种格式,默认为url
url
, b64_json
图片输出格式,支持 png/jpg/webp 三种格式,默认为png
png
, jpg
, webp
自动重试次数,默认0,表示失败不重试
0