简体中文
目前支持文本转语音的模型有 whisper-1、gpt-4o-transcribe 以及 gpt-4o-mini-transcribe,你可以通过如下方式调用:
whisper-1
gpt-4o-transcribe
gpt-4o-mini-transcribe
curl --location 'https://geekai.co/api/v1/audio/transcriptions' \ --header 'Authorization: {YOUR_GEEKAI_API_KEY}' \ --form 'file=@"/C:/User/GeekAI/Downloads/2cd359fe642c33deaa943f7306d73f30.mp3"' \ --form 'model="whisper-1"' \ --form 'response_format="text"'
其中 gpt-4o-transcribe 以及 gpt-4o-mini-transcribe 仅支持 json 响应。
json
OpenAI 支持的上传音频格式(通过 response_format 指定)如下:flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav 或 webm。
response_format
flac
mp3
mp4
mpeg
mpga
m4a
ogg
wav
webm