请求示例

目前仅 doubao-embedding-visionmultimodal-embedding-v1embed-english-v3.0embed-multilingual-v3.0 模型支持图文向量化,其他模型暂不支持。

curl --location 'https://geekai.co/api/v1/embeddings' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer {YOUR_GEEKAI_API_KEY}' \
--data '{
    "input": [
        {
            "type": "text",
            "text": "天很蓝,海很深"
        },
        {
            "type": "image_url",
            "image_url": {
                "url": "https://ark-project.tos-cn-beijing.volces.com/images/view.jpeg"
            }
        }
    ],
    "model": "doubao-embedding-vision"
}'

注:图片支持 URL 和 Base64 编码两种格式,其中 Cohere 平台模型不支持图文混合,仅支持单独文本或图片向量化。

其中 multimodal-embedding-v1 除了支持图片之外,还支持视频向量化,示例如下:

curl --location 'https://geekai.co/api/v1/embeddings' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer {YOUR_GEEKAI_API_KEY}' \
--data '{
    "input": [
        {
            "type": "text",
            "text": "坐在壁炉前品尝咖啡"
        },
        {
            "type": "video_url",
            "video_url": {
                "url": "https://static.geekai.co/video/new_video.mp4"
            }
        }
    ],
    "model": "multimodal-embedding-v1"
}'

格式说明

doubao-embedding-vision 支持的图片格式如下表:

图片格式文件扩展名内容格式 Content Type
JPEG.jpg, .jpegimage/jpeg
PNG.apng, .pngimage/png
GIF.gifimage/gif
WEBP.webpimage/webp
BMP.bmpimage/bmp
TIFF.tiff, .tifimage/tiff
ICO.icoimage/x-icon
DIB.dibimage/bmp
ICNS.icnsimage/icns
SGI.sgiimage/sgi
JPEG2000.j2c, .j2k, .jp2, .jpc, .jpf, .jpximage/jp2

multimodal-embedding-v1 支持的图片格式为 JPG、PNG、BMP,支持视频格式为 MP4、MPEG、MPG、WEBM、AVI、FLV、MKV、MOV,请自行确保提交的多模态数据格式正确。

Cohere 平台向量模型 embed-english-v3.0embed-multilingual-v3.0 图片格式仅支持 JPG、PNG。

尺寸说明

doubao-embedding-vision 模型图片尺寸需要同时满足以下条件,否则会返回错误信息:

  • 图片的宽和高的长度取值范围:[10, 6000] px
  • 图片的宽高比(即宽/高)取值范围:[1/100, 100]

另外,doubao-embedding-vision 单图最大不超过 10M,multimodal-embedding-v1 单图最大不超过 3M,单个视频最大不超过 10M。