“新五强”争锋，基础大模型玩家再洗牌正观新闻

文｜魏琳华

编｜王一粟

大模型公司正在进行新一轮的排位赛。

AI应用如火如荼，但在“看不见”的水面之下，基础大模型的战争仍在继续。不像预期般放缓脚步，而是变得更“卷”了：

据光锥智能不完全统计，2025年开始至今，中国参与模型竞争的百度、字节、阿里、DeepSeek和“六小虎”等主要大模型公司，发布了超过45款基础大模型（不包括行业垂类大模型），相当于每3.3天，就有一款新的模型发布。

而在上半年，国内大模型公司的第一梯队，正在无限接近海外第一梯队的格局。

对比三家大厂+两家创业公司组合成海外“五强”的OpenAI、Google、Anthropic、X.AI和Meta，国内大模型团队也在分化成由阿里、字节、DeepSeek、阶跃星辰和智谱的“3+2”组合，成为国内的“新基模五强”。

神仙打架，“新基建五强”半年发30个大模型

上半年，基础大模型领域仍然是“神仙打架”的局面。

以国内“基模五强”公司上半年发布的模型数量统计来看，五家公司共发布32个大模型。从发布数量上来看，阿里和阶跃星辰是突出的两个“卷王”，其中阶跃星辰发布11款模型，阿里发布9款模型，加起来超过五家公司的半数。

结合大模型行业发展趋势，开源、推理和多模态，成为三个关键词：

从时间线来看，五家公司中，阿里、智谱和DeepSeek三家早就坚定走开源路线。

其中，阿里是独一无二的“开源卷王”，自2023年起，阿里就将旗下多款模型发布在开源社区。无论从开源数量还是类型来说，阿里都是最全面的一家。

这也让阿里成为了当下多个领域的开源SOTA提供者。4月29日上线的混合推理模型Qwen3成为目前全球最强的开源模型，而其成本仅为DeepSeek-R1的35%。

当然，在Qwen3之前，国内上一个掀起推理模型热的公司，就是“鲶鱼”DeepSeek。

对比上述四家公司，DeepSeek是唯一一家“专才”，不做大模型矩阵。比如春节期间发布的推理大模型DeepSeek R1，性能拉满的同时做到了极低成本，训练只要GPT-4o的1/10，输入成本更是低至2%，一举出圈，成为后续推理大模型的“标杆”。

多模态大模型，则是今年大模型公司的研发重点方向。

比如，被称为“多模态卷王”的阶跃星辰，目前共发布22个基础模型，其中多模态领域的大模型高达16个。

其中，阶跃星辰联合吉利开源文生视频大模型Step-Video-T2V，成为当时全球范围内参数量最大、性能最好的开源视频生成大模型，Step-Audio则是行业内首个产品级的开源语音交互模型。

布局全面的字节今年在多模态领域表现也开始加入第一梯队。以文生图模型Seedream 3.0来说，除了提升画质和生成效率之外，它还提升了AI生图在商业化领域的应用能力。由此，其对应产品即梦AI的文生图效果一度出圈。

不过，相比大语言模型，行业内多模态大模型的发展程度还远远不够。用姜大昕的话来说，“多模态模型领域，目前还没有出现GPT-4时刻。”

在姜大昕看来，它的卡点就在于整个行业缺少多模态领域的理解生成一体化架构。大语言模型已经做到了，但多模态大模型的理解和生成仍然由不同的模型完成。对于计算机视觉来说，这是一个几十年没有解决的顽固问题。

对比大语言模型的ChatGPT和推理模型DeepSeek-R1，多模态领域仍有机会等到下一个爆款模型。

走向AGI，什么是必经之路？

在AI应用落地如火如荼、Scaling Law边际效益递减的今天，继续押注基础大模型还有价值吗？

100天之前，DeepSeek的发布无疑给行业了一个无比确定的答案。

“一切变化都太快了，每天早上起来，新模型、新产品的发布都可能颠覆掉过往的认知。”一位创业者向光锥智能感慨道。

正如我们上面提到，这半年，模型发布的速度不减反增。同时，由模型能力提升带来的技术红利让DeepSeek们站到台前，而没有技术优势的公司则在投资热情退潮时，失去了继续立在第一梯队的机会。

为了更长久地留在牌桌上，无论是大厂还是创业公司，抢钱、抢人才，依旧是2025年的主旋律。

如今，算力、人才和资金仍然是衡量大模型公司立在牌桌上的三个硬指标。对大厂来说，资金自然不成问题，但对于创业公司来说，必须拉到足够的投资来为公司前期的研发买单。

以资金作为衡量指标，大厂自然相对充沛，但是初创阵营中只有“北京队”智谱和“上海队”阶跃星辰这两家被国资看好的企业，可以在大模型公司的寒冬期持续获得资本青睐。

以智谱来说，它在三月接连拿下杭州、珠海和成都三家国资的投资，累计共达到18亿人民币；去年12月，阶跃星辰拿到数亿美元资金，完成B轮融资。

再从人才衡量，目前“基模五强”正在展现对人才的虹吸效应。以字节来说，从2023-2025年，这家公司挖走了海内外的多位研发骨干，比如曾任谷歌DeepMind研究副总裁的吴永辉，今年加入字节成为大模型团队Seed的基础研究负责人。

在大量堆积资金和人才的基础上，上述基模五强逐渐建立了优势：“开源卷王”阿里用生态拉拢B端用户，字节则一边补齐基础模型的版图，一边靠豆包、扣子等应用反哺模型升级，DeepSeek靠性能和低价成为性价比之王，智谱的大模型落地在政企端优势明显，阶跃则成了“多模态卷王”，发出多款SOTA模型。

上述企业的目标都是继续提升大模型的“智能上限”，用溢出的模型能力支撑AI应用的能力突破。

以智能体（Agent）来说，其关键能力在于多模态、慢思考以及记忆能力。

有了多模态理解能力，才能让以大模型为技术底座的Agent能够“阅读”并理解手机和电脑屏幕中的信息，从而让AI也能够代替人类操作智能终端；而推理能力则让AI能够根据用户需求拆解任务，按照每一个规划好的步骤推进，最终完成任务。

Google DeepMind CEODemis Hassabis认为，目前通往 AGI 的道路已经开始变得清晰，但要真正抵达这个目标，仍需要突破多个技术瓶颈，整合多项关键能力。

在有限的时间内，谁的硬指标更全面、基座模型能力更强，谁才能有机会真正获得AGI的入场券。

大模型商业化趋势：开源、垂类场景落地

商业化是基础大模型公司不能跳过去的命题，其商业化的策略，往往和技术的战略也一脉相承。

2025年，开源和垂类场景应用成为模型商业化的两个关键方向。

先来说开源，开源的中国大模型已经在全球占据了半壁江山。目前，在开源社区HuggingFace上，前30的热门模型，已经有12个模型来自于中国公司，其中出现了阶跃星辰最新的音乐模型ACE-Step、DeepSeek的R1和Prover-v2、阿里的Qwen3系列、字节Seed的小参数代码模型和腾讯混元的AI视频模型。

开源之后，大模型公司可以尝试的商业化手段变得更加多样：国内以DeepSeek和阿里作为代表，采用的是更加开放的协议，这种模型一般可以走三种模式，最直观的是调用API付费，云厂商则通过提供GPU服务收“水电费”，另外，围绕开源模型的定制化调整和技术服务也是一种模式。

不过，真正能直接使用开源模型的企业和个人都是少数，多数人更需要一个“开箱即用”的完整产品。所以，AI在垂类场景的应用越来越火热。

最火热的无疑就是各行各业的智能体（Agent），从政企、金融到医疗，智能体可谓无处不在。但目前热度更高的，还是智能体和智能终端的结合。

为什么智能体+智能终端成为了关键的落地方向？

“汽车不仅具有高价值的软硬件系统，还与用户有着密切的联系，这使其成为理想的AI载体。”长城汽车CTO吴会肖说。同样，这条规则也适用于手机、具身智能等产品。

而对于厂商来说，和多模态、强化学习能力等相同，做Agent，同样也是大模型企业通向AGI之路的基石之一。在OpenAI给出的AGI五阶段来说，Agent对应的就是L3阶段，即AI拥有自主操作能力，在L3的基础上，AI才能进一步追求自主学习的能力。

所以，对于大模型公司来说，做Agent的商业化战略就是在技术基础上延伸而来的一步棋。

阶跃星辰和智谱，这两家大模型的南北双雄，也不约而同地都瞄准了智能终端赛道。

智谱在去年就推出了能够在手机端运行的智能体AutoGLM，让Agent接管各种应用调配，实现用户需求。

而在今年，阶跃星辰进一步扩大了Agent在智能终端的落地范围，在2月份的开放日上，这家公司放出了Agent在汽车、手机、具身智能、IoT四个领域的应用。

如今，各家大模型公司都在抢夺智能终端客户的订单。以阶跃星辰来说，在今年拿到了和OPPO、千里科技、吉利汽车集团、智元机器人等厂商的合作。

Agent能力的叠加，也在成为智能终端产品的卖点。比如，搭载了“一键全能搜”、“一键问屏”的OPPO手机Find N5和Find X8销量亮眼。据悉，其中Find X8成为Find 系列史上同期销量最高的产品。

比起其他业务来说，智能体+智能终端的合作，也为企业带来了可观的收入。据《智能涌现》报道，随着三星等大单的签订，智谱节后不到一个月，收入已经过亿。

从这一代AI大模型公司的商业化来看，大家都在避免传统ToB赛道重复造轮子的私有化定制，希望借助技术的红利，把产品尽量做得标准化，以此来实现更高的毛利率。

无论是提供开源工具的“自助火锅店”，还是垂类智能体的“私房菜餐厅”，大模型商业化的前景都在变得越来越乐观。