价格
7 个主流模型,最高省 84%
表中"输入 / 输出 / 缓存读 / 缓存写"都是你的实付单价(USD / 100 万 token)。 官方价 = Anthropic / OpenAI 直连价,仅作对比。
※ "输入 / 输出 / 缓存读 / 缓存写" 列均为你实付单价。"省" = 相对 Anthropic / OpenAI 直连官方价节省的百分比。 USD ↔ CNY 按 1 USD ≈ ¥7.20 折算。
关于"网络系数"
因为我们的供应来自美国订阅用户的闲置时间,所以每分钟可用配额会随着对方的作息变化。这就是为什么单价会带一个浮动系数:
- 中国白天 9:00 ~ 18:00(美国深夜 21:00 ~ 次日 6:00):对方在睡觉,闲置最多 → 系数 0.8× ~ 1.0×,最便宜的时段
- 中国晚 18:00 ~ 22:00(美国早高峰 6:00 ~ 10:00):对方陆续起床开工,供应紧一点 → 系数 ~1.2×
- 极端高峰:理论上限 1.5×,但 99% 时段不会达到
换句话说:对成本敏感的批量任务跑白天,对响应延迟敏感的实时调用挑非高峰,能再省一档。 实时单价会显示在你的客户端调用响应里。