文本对话
文件对话
PDF 对话
目前仅 Gemini 系列对话模型支持原生的 PDF 文件对话,以下是 PDF 文件对话请求示例:
支持多文件对话,和图片对话类似,多个 PDF 文件以 file_url
对象传入到 content
列表即可:
需要注意的是,Gemini 模型不限制 PDF 文件数量,但是限制 PDF 文档页数,所有 PDF 文档页面不得超过 1000 页。
纯文本文件对话
除了 PDF 文件外,Gemini 模型还支持以下纯文本格式文件对话:
- JavaScript,对应
mime_type
为text/javascript
- Python,对应
mime_type
为text/x-python
- TXT,对应
mime_type
为text/plain
- HTML,对应
mime_type
为text/html
- CSS,对应
mime_type
为text/css
- Markdown,对应
mime_type
为text/markdown
- CSV,对应
mime_type
为text/csv
- XML,对应
mime_type
为text/xml
- RTF,对应
mime_type
为text/rtf
以 Markdown 文件为例,示例代码如下,和 PDF 对话格式一样,只需要替换 url
然后将 mime_type
改为 text/markdown
即可:
需要注意的是,文件对话不支持低价渠道,会直接调用官方API进行对话,不过对于 Gemini 2.5 及以上版本,会自动开启提示缓存,从而大幅降低对话成本。
其他模型/Office文档
非 Gemini 系列模型要进行文件对话或者想要和 Office 文件对话,请通过文件上传/读取接口先获取文件内容,再将文件内容作为对话上下文进行文件对话,该接口支持多种格式文档,包括 PDF、Office、纯文本等。