文本转语音

语音合成接口

curl --request POST \
  --url https://geekai.co/api/v1/audio/speech \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "tts-1",
  "input": "你好, 很高兴见到你!",
  "voice": "alloy",
  "response_format": "mp3",
  "stream_format": "audio",
  "speed": 1,
  "instructions": "<string>",
  "retries": 0
}
'

"<string>"

POST

audio

speech

语音合成接口

curl --request POST \
  --url https://geekai.co/api/v1/audio/speech \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "tts-1",
  "input": "你好, 很高兴见到你!",
  "voice": "alloy",
  "response_format": "mp3",
  "stream_format": "audio",
  "speed": 1,
  "instructions": "<string>",
  "retries": 0
}
'

"<string>"

注：语音模型名称设置参考系统支持语音模型列表，请求/响应参数结构完全兼容 OpenAI，切换模型时只需修改对应的模型名称即可，若模型请求/响应参数和OpenAI不一致，极客智坊底层会自动转换对齐。

响应数据格式和 OpenAI 完全兼容，即返回音频文件的二进制数据。关于文本转语音 API 调用示例，可以参考这里：文本对话。

请求/响应参数明细

Authorizations

Authorization

string

header

required

API认证token

Body

application/json

model

string

required

语音模型

Example:

"tts-1"

input

string

required

需要转换的文本内容

Example:

"你好, 很高兴见到你!"

voice

string

声音角色，不同平台支持的声音角色可能不一样，更多细节请查看文本转语音示例。

Example:

"alloy"

response_format

string

default:mp3

音频格式，不同平台支持格式可能不一样，更多细节请查看文本转语音示例。

stream_format

enum<string>

default:audio

语音输出格式，支持 sse/audio 两种格式，sse表示流式输出，audio表示输出音频文件，默认为audio

可用选项:

sse,

audio

speed

enum<number>

default:1

语速，取值范围[0.25, 1.0, 4.0]，默认1.0，其中豆包语音模型仅支持[0.5, 1, 2]三个档位

可用选项:

0.25,

0.5,

1,

2,

4

instructions

string

使用额外指令来控制生成的音频音调，仅 gpt-4o-mini-tts 模型支持该参数

retries

integer

default:0

自动重试次数，默认0，表示失败不重试

Response

成功响应

MP3格式音频

语音转文本语音转文本v2

⌘I

文本模型

画图模型

语音模型

视频模型

3D模型

模型列表

文件对话

OCR服务

令牌管理

账单信息

请求/响应参数明细

Authorizations

Body

Response

文本模型

画图模型

语音模型

视频模型

3D模型

模型列表

文件对话

OCR服务

令牌管理

账单信息

​请求/响应参数明细

Authorizations

Body

Response

请求/响应参数明细