支持的模型
目前仅 Gemini 对话模型支持原生的 PDF 文件对话,包括:gemini-2.5-progemini-2.5-pro:fastgemini-2.5-flashgemini-2.5-flash:no-thinkinggemini-2.5-flash-litegemini-2.5-flash-lite:no-thinkinggemini-2.0-flashgemini-2.0-flash-litegemini-2.5-flash-preview-09-2025gemini-2.5-flash-lite-preview-09-2025
- 分析和解读内容,包括文本、图像、图表和表格,支持长达 1000 页的文档
- 将信息提取为结构化输出格式
- 基于文档的视觉和文本元素进行总结并回答问题
- 转录文档内容(例如转录为 HTML),保留其布局和格式,以便在下游应用程序中使用
PDF 对话
单文件 以下是单文件 PDF 文件对话请求示例:curl
file_url 对象传入到 content 列表即可:
curl
纯文本文件对话
除了 PDF 文件外,Gemini 模型还支持以下纯文本格式文件对话:- JavaScript,对应
mime_type为text/javascript - Python,对应
mime_type为text/x-python - TXT,对应
mime_type为text/plain - HTML,对应
mime_type为text/html - CSS,对应
mime_type为text/css - Markdown,对应
mime_type为text/markdown - CSV,对应
mime_type为text/csv - XML,对应
mime_type为text/xml - RTF,对应
mime_type为text/rtf
url 然后将 mime_type 改为 text/markdown 即可:
curl
