Kimi K2模型响应慢遭质疑,月之暗面紧急回应称正全力优化推理效率

新识研究所 取材网络

2025-07-16 20:50

针对近期用户集中反馈的Kimi K2模型API响应速度慢问题,AI创业公司月之暗面于7月15日晚间通过官方渠道发布声明,承认当前服务存在延迟,并表示正采取多项措施提升性能,预计未来几天内将实现明显改善。

多位开发者及企业用户反映,自7月11日月之暗面发布Kimi K2模型并开放API服务以来,频繁遭遇请求超时、响应延迟等问题。有用户测试数据显示,在非峰值时段,简单问答的响应时间也常超过10秒,复杂任务甚至需要等待30秒以上。

月之暗面在声明中将问题归因于"访问量激增与模型体积庞大的双重压力"。该公司表示,Kimi K2作为采用MoE架构的万亿参数模型,尽管激活参数控制在320亿,但复杂的专家选择机制仍对计算资源提出极高要求。目前已启动紧急预案,包括优化推理引擎、增加GPU算力投入及改进负载均衡策略。

业内分析指出,Kimi K2面临的性能瓶颈折射出大模型商业化初期的普遍困境。某头部AI公司技术总监表示:"MoE架构虽能平衡模型规模与计算效率,但在流量波动情况下的资源调度难度显著高于 dense 模型。月之暗面作为初创企业,可能低估了开源模型带来的访问量冲击。"。

月之暗面在声明中建议受影响用户可通过硅基流动、无问芯穹等第三方供应商接入服务,或自行部署模型以获得更稳定的体验。这一措施虽能缓解官方API压力,但也凸显出开源模型在服务保障方面的挑战。

值得注意的是,类似情况在行业巨头中亦有先例。OpenAI的GPT-4 Turbo上线初期曾因流量超出预期导致服务不稳定,历时两周才实现性能稳定。相比之下,月之暗面承诺的"几天内改善"显示出其在工程优化方面的压力。

据了解,Kimi K2当前API计费为输入 tokens 4元/百万、输出 tokens 16元/百万,价格仅为GPT-4 Turbo的60%。有行业观察者认为,性能问题若不能及时解决,可能影响其市场竞争力,尤其在企业级客户拓展方面。

截至发稿,月之暗面尚未公布具体的性能优化技术细节及确切的改善时间表。市场将持续关注其能否兑现承诺,在激烈的大模型竞争中守住先发优势。

特别声明
本文为正观号作者或机构在正观新闻上传并发布,仅代表该作者或机构观点,不代表正观新闻的观点和立场,正观新闻仅提供信息发布平台。
最新评论
打开APP查看更多精彩评论

微信扫一扫
在手机上浏览