语音模型
语音转文本
将音频文件转换为文字的接口,支持多种音频格式和转录选项。
POST
注:语音模型名称设置参考系统支持转录语音模型列表,请求/响应参数结构完全兼容 OpenAI,切换模型时只需修改对应的模型名称即可,若模型请求/响应参数和OpenAI不一致,极客智坊底层会自动转换对齐。
响应数据格式和 OpenAI 语音转录文本接口完全兼容。
关于语音转录文本 API 调用示例,可以参考这里:语音转文本。
请求/响应参数明细
Authorizations
JWT认证token
Body
multipart/form-data
语音识别模型
音频文件
提示文本,用于指导转录风格
音频语言
响应格式,
Available options:
text
, srt
, vtt
, json
是否返回流式响应,默认false,whisper-1 模型不支持该设置
Example:
true
采样温度,控制输出的随机性
自动重试次数,默认0,表示失败不重试
Response
200
text/plain
成功响应
纯文本格式的转录结果