月之暗面回应 Kimi K2 模型 API 速度慢: 正在优化推理效率

  • 2025-07-17 12:15:18
  • 239

IT之家7月15日消息,月之暗面今晚发文回应KimiK2模型API速度慢:“主要问题是访问量大+模型体积大。我们正在全力优化推理效率,也在加卡加机器。预计这几天内速度会有明显提升。”

同时,月之暗面还提到KimiK2是完全开源的,大家也可以通过其他模型供应商接入使用(比如硅基流动、无问芯穹等)。也欢迎自行部署。

据IT之家此前报道,月之暗面7月11日正式发布KimiK2模型,并同步开源。KimiK2是一款具备更强代码能力、更擅长通用Agent任务的MoE架构基础模型,总参数1T,激活参数32B。

KimiK2的API服务现已全面上线,支持最长128K上下文,具备更强的通用性与工具调用能力。计费方案如下:

每百万输入tokens:4元

每百万输出tokens:16元