POST
/
images
/
generations
图片生成接口
curl --request POST \
  --url https://geekai.co/api/v1/images/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
  "model": "gpt-image-1",
  "prompt": "画一只可爱的小猫",
  "negative_prompt": "<string>",
  "image": "<string>",
  "strength": 0.5,
  "size": "1024x1024",
  "aspect_ratio": "1:1",
  "n": 1,
  "quality": "medium",
  "style_preset": "3d-model",
  "response_format": "url",
  "output_format": "png",
  "mask": "<string>",
  "watermark": false,
  "background": "<string>",
  "async": false,
  "retries": 0
}'
{
  "task_id": "3c90c3cc-0d44-4b50-8888-8dd25736052a",
  "task_status": "running",
  "created": 123,
  "data": [
    {
      "url": "<string>",
      "revised_prompt": "<string>"
    }
  ]
}
注:你可以在模型广场筛选查看系统支持的画图模型列表,画图模型基础请求/响应参数结构兼容 OpenAI,同时扩展了一些新的参数来适配其他模型的功能,切换模型时只需修改对应的模型名称即可,若模型请求/响应参数和 OpenAI 不一致,极客智坊底层会自动转换对齐。 响应数据格式和 OpenAI 完全兼容。
不同AI平台的画图模型支持的尺寸不一样,具体支持的尺寸请参考下面的表格:
平台模型支持的尺寸
OpenAIGPT-Image-11024x1024,1024x1536,1536x1024,auto,默认是auto
GoogleImagen系列无尺寸配置,支持宽高比:1:1、3:4、4:3、9:16、16:9, 默认1:1,HTTP调用只支持默认值。
智谱清言CogView系列1024x1024,768x1344,864x1152,1344x768, 1152x864,1440x720,720x1440,默认是1024x1024
阿里巴巴通义万相系列图像宽高边长的像素范围为:[768, 1440],单位像素。 可任意组合以设置不同的图像分辨率,最高可达200万像素。 默认值:1024*1024
可灵AIkling系列无尺寸配置,支持宽高比:16:9、9:16、1:1、4:3、3:4、3:2、2:3, 默认1:1
即梦AI即梦系列支持宽高比及对应尺寸:512x512(默认值)、512x384、384x512、512x341、 341x512、512x288、288x512
StabilityStable Image系列图像宽高边长的像素范围为:[64, 16384],单位像素。 可任意组合以设置不同的图像分辨率,总像素数至少需要达到 4096 像素。
Midjourney
画图模型 API 调用示例可以参考这里:生成图像

请求/响应参数明细

Authorizations

Authorization
string
header
required

JWT认证token

Body

application/json
model
string
required

图片生成模型

Example:

"gpt-image-1"

prompt
string
required

文本提示

Example:

"画一只可爱的小猫"

negative_prompt
string

反向提示词,用来描述不希望在画面中看到的内容,可以对画面进行限制

image
string<string>

用于以图生图,支持图片URL/Base64编码,仅图生图模型支持该配置

strength
number
default:0.5

以图生图引用图片的影响强度,取值范围[0, 1],默认0.5

size
string
default:1024x1024

图片尺寸,不同模型设置不同,详见模型尺寸表

aspect_ratio
string
default:1:1

图片宽高比,不同模型设置不同,详见模型尺寸表

n
integer
default:1

图片数量,默认为1

quality
string
default:medium

图片质量,可灵AI支持 std、pro 两个配置,OpenAI/智谱清言支持 standard、hd 两个配置,GPT Image支持 auto/low/medium/high 四个配置项

style_preset
string

风格预设,目前仅 stable image 支持该配置

Example:

"3d-model"

response_format
enum<string>
default:url

图片响应格式,支持 url/b64_json 两种格式,默认为url

Available options:
url,
b64_json
output_format
enum<string>
default:png

图片输出格式,支持 png/jpg/webp 三种格式,默认为png

Available options:
png,
jpg,
webp
mask
string

图片遮罩,支持图片URL/Base64编码数据

watermark
boolean
default:false

是否添加AI生成水印,默认为false,仅部分模型支持

background
string

背景透明度

async
boolean
default:false

是否异步生成,默认false,即同步等待图片生成成功后返回生成结果,如果异步需要通过调用图片获取接口获取生成结果

retries
integer
default:0

自动重试次数,默认0,表示失败不重试

Response

成功响应

created
integer
required

创建时间戳

data
object[]
required

生成的图片列表(仅在task_status=succeed时返回)

task_id
string<uuid>

图片生成任务ID

task_status
enum<string>

任务状态

Available options:
pending,
running,
succeed,
failed
Example:

"running"