大多数模型供应商会自动启用提示缓存,如 OpenAI/DeepSeek/Kimi 都是这样,而 Claude 需要通过在请求体中指定 cache_control 参数来启用提示缓存。
OpenAI
缓存价格:- 缓存写入免费;
- 缓存读取价格是正常输入价格的 0.5 倍。
Claude
缓存价格:- 缓存写入价格是正常输入价格的 1.25 倍;
- 缓存读取价格是正常输入价格的 0.1 倍。
cache_control 参数来启用,系统消息和用户消息都可以启用提示缓存,系统消息提示缓存示例如下:
- Claude 3.7 Sonnet、Claude 3.5 Sonnet 以及 Claude 3 Opus 需要 1024 个 token
- Claude 3.5 Haiku 和 Claude 3 Haiku 需要 2048 个 token
DeepSeek
缓存价格:- 缓存写入免费;
- 缓存读取价格是正常输入价格的 0.1 倍。
Gemini
缓存价格:- 缓存写入免费;
- 缓存读取价格是正常输入价格的 0.25 倍。
