目前支持文本转语音的模型有 whisper-1gpt-4o-transcribe 以及 gpt-4o-mini-transcribe,你可以通过如下方式调用:

curl --location 'https://geekai.co/api/v1/audio/transcriptions' \
    --header 'Authorization: {YOUR_GEEKAI_API_KEY}' \
    --form 'file=@"/C:/User/GeekAI/Downloads/2cd359fe642c33deaa943f7306d73f30.mp3"' \
    --form 'model="whisper-1"' \
    --form 'response_format="text"'

其中 gpt-4o-transcribe 以及 gpt-4o-mini-transcribe 仅支持 json 响应。

音频格式

OpenAI 支持的上传音频格式(通过 response_format 指定)如下:flac, mp3, mp4, mpeg, mpga, m4a, ogg, wavwebm