Kimi K2模型响应慢遭质疑，月之暗面紧急回应称正全力优化推理效率正观新闻

Kimi K2模型响应慢遭质疑，月之暗面紧急回应称正全力优化推理效率

2025-07-16 20:50

针对近期用户集中反馈的Kimi K2模型API响应速度慢问题，AI创业公司月之暗面于7月15日晚间通过官方渠道发布声明，承认当前服务存在延迟，并表示正采取多项措施提升性能，预计未来几天内将实现明显改善。

多位开发者及企业用户反映，自7月11日月之暗面发布Kimi K2模型并开放API服务以来，频繁遭遇请求超时、响应延迟等问题。有用户测试数据显示，在非峰值时段，简单问答的响应时间也常超过10秒，复杂任务甚至需要等待30秒以上。

月之暗面在声明中将问题归因于"访问量激增与模型体积庞大的双重压力"。该公司表示，Kimi K2作为采用MoE架构的万亿参数模型，尽管激活参数控制在320亿，但复杂的专家选择机制仍对计算资源提出极高要求。目前已启动紧急预案，包括优化推理引擎、增加GPU算力投入及改进负载均衡策略。

业内分析指出，Kimi K2面临的性能瓶颈折射出大模型商业化初期的普遍困境。某头部AI公司技术总监表示："MoE架构虽能平衡模型规模与计算效率，但在流量波动情况下的资源调度难度显著高于 dense 模型。月之暗面作为初创企业，可能低估了开源模型带来的访问量冲击。"。

月之暗面在声明中建议受影响用户可通过硅基流动、无问芯穹等第三方供应商接入服务，或自行部署模型以获得更稳定的体验。这一措施虽能缓解官方API压力，但也凸显出开源模型在服务保障方面的挑战。

值得注意的是，类似情况在行业巨头中亦有先例。OpenAI的GPT-4 Turbo上线初期曾因流量超出预期导致服务不稳定，历时两周才实现性能稳定。相比之下，月之暗面承诺的"几天内改善"显示出其在工程优化方面的压力。

据了解，Kimi K2当前API计费为输入 tokens 4元/百万、输出 tokens 16元/百万，价格仅为GPT-4 Turbo的60%。有行业观察者认为，性能问题若不能及时解决，可能影响其市场竞争力，尤其在企业级客户拓展方面。

截至发稿，月之暗面尚未公布具体的性能优化技术细节及确切的改善时间表。市场将持续关注其能否兑现承诺，在激烈的大模型竞争中守住先发优势。

特别声明

本文为正观号作者或机构在正观新闻上传并发布，仅代表该作者或机构观点，不代表正观新闻的观点和立场，正观新闻仅提供信息发布平台。