目前支持文本转语音的模型有 whisper-1
、gpt-4o-transcribe
以及 gpt-4o-mini-transcribe
,你可以通过如下方式调用:
curl --location 'https://geekai.co/api/v1/audio/transcriptions' \
--header 'Authorization: {YOUR_GEEKAI_API_KEY}' \
--form 'file=@"/C:/User/GeekAI/Downloads/2cd359fe642c33deaa943f7306d73f30.mp3"' \
--form 'model="whisper-1"' \
--form 'response_format="text"'
其中 gpt-4o-transcribe
以及 gpt-4o-mini-transcribe
仅支持 json
响应。
音频格式
OpenAI 支持的上传音频格式(通过 response_format
指定)如下:flac
, mp3
, mp4
, mpeg
, mpga
, m4a
, ogg
, wav
或 webm
。