2025.08.06 支持 GPT OSS 20B&120B

极客智坊已支持 GPT OSS 开源模型 极客智坊已支持 OpenAI 最新发布的 GPT OSS 20B 和 GPT OSS 120B —— 两款性能卓越的开源轻量级语言模型,可在低成本下实现强大的实际应用性能:
  • GPT OSS 120B 模型在核心推理基准测试中与 OpenAI o4-mini 模型几乎持平,同时能在单个 80GB GPU 上高效运行。
  • GPT OSS 20B 模型在常见基准测试中与 OpenAI o3‑mini 模型取得类似结果,且可在仅配备 16GB 内存的边缘设备上运行,使其成为设备端应用、本地推理或无需昂贵基础设施的快速迭代的理想选择。
这两个模型在工具使用、少样本函数调用、CoT推理(如在 Tau-Bench 智能体评估套件中的结果所示)以及 HealthBench 测试中表现强劲(甚至超越了 OpenAI o1 和 GPT‑4o 等专有模型): GPT OSS 20B 和 120B 基准测试性能对比代码篇 GPT OSS 20B 和 120B 基准测试性能对比人类考试篇 GPT OSS 20B 和 120B 基准测试性能对比健康医药篇 GPT OSS 20B 和 120B 基准测试性能对比数学篇 GPT OSS 20B 和 120B 基准测试性能对比工具调用篇 欢迎体验👉 所有模型支持通过极客智坊 Chat & Response API 进行调用,你可以在模型广场进行查看和选用,模型 API 调用示例请参考 API 使用文档

2025.08.05 支持 Claude Opus 4.1

极客智坊已支持 Claude Opus 4.1 极客智坊已支持 Anthropic 最新发布的 Claude Opus 4.1, 这是 Claude Opus 4 在智能体任务、实际编码和推理方面的一次升级。这一性能飞跃大致相当于从 Sonnet 3.7 升级到 Sonnet 4 所带来的提升。 Opus 4.1 将 Claude 最先进的编码性能提升至 SWE-bench Verified 的 74.5%,它还增强了 Claude 深入研究和数据分析的能力,尤其是在细节追踪和智能搜索方面: Claude Opus 4.1 基准测试性能对比 欢迎体验👉 所有模型支持通过极客智坊 API 进行调用,你可以在模型广场进行查看和选用,模型 API 调用示例请参考 API 使用文档 为降低用户调用 Claude 4 API 成本,极客智坊提供了不同渠道的折扣优惠,最低1折: 极客智坊支持低价调用 Claude Opus 4.1 API 极客智坊同时也兼容对 Message API 的支持,因此你还可以在 Claude Code 中使用,具体安装配置方法请参考Claude Code 接入教程