“新五强”争锋,基础大模型玩家再洗牌

光锥智能 原创

2025-05-13 20:56

文|魏琳华

编|王一粟

大模型公司正在进行新一轮的排位赛。

AI应用如火如荼,但在“看不见”的水面之下,基础大模型的战争仍在继续。不像预期般放缓脚步,而是变得更“卷”了:

据光锥智能不完全统计,2025年开始至今,中国参与模型竞争的百度、字节、阿里、DeepSeek和“六小虎”等主要大模型公司,发布了超过45款基础大模型(不包括行业垂类大模型),相当于每3.3天,就有一款新的模型发布。

而在上半年,国内大模型公司的第一梯队,正在无限接近海外第一梯队的格局。

对比三家大厂+两家创业公司组合成海外“五强”的OpenAI、Google、Anthropic、X.AI和Meta,国内大模型团队也在分化成由阿里、字节、DeepSeek、阶跃星辰和智谱的“3+2”组合,成为国内的“新基模五强”。

神仙打架,“新基建五强”半年发30个大模型

上半年,基础大模型领域仍然是“神仙打架”的局面。

以国内“基模五强”公司上半年发布的模型数量统计来看,五家公司共发布32个大模型。从发布数量上来看,阿里和阶跃星辰是突出的两个“卷王”,其中阶跃星辰发布11款模型,阿里发布9款模型,加起来超过五家公司的半数。

结合大模型行业发展趋势,开源、推理和多模态,成为三个关键词:

从时间线来看,五家公司中,阿里、智谱和DeepSeek三家早就坚定走开源路线。

其中,阿里是独一无二的“开源卷王”,自2023年起,阿里就将旗下多款模型发布在开源社区。无论从开源数量还是类型来说,阿里都是最全面的一家。

这也让阿里成为了当下多个领域的开源SOTA提供者。4月29日上线的混合推理模型Qwen3成为目前全球最强的开源模型,而其成本仅为DeepSeek-R1的35%。

当然,在Qwen3之前,国内上一个掀起推理模型热的公司,就是“鲶鱼”DeepSeek。

对比上述四家公司,DeepSeek是唯一一家“专才”,不做大模型矩阵。比如春节期间发布的推理大模型DeepSeek R1,性能拉满的同时做到了极低成本,训练只要GPT-4o的1/10,输入成本更是低至2%,一举出圈,成为后续推理大模型的“标杆”。

多模态大模型,则是今年大模型公司的研发重点方向。

比如,被称为“多模态卷王”的阶跃星辰,目前共发布22个基础模型,其中多模态领域的大模型高达16个。

其中,阶跃星辰联合吉利开源文生视频大模型Step-Video-T2V,成为当时全球范围内参数量最大、性能最好的开源视频生成大模型,Step-Audio则是行业内首个产品级的开源语音交互模型。

布局全面的字节今年在多模态领域表现也开始加入第一梯队。以文生图模型Seedream 3.0来说,除了提升画质和生成效率之外,它还提升了AI生图在商业化领域的应用能力。由此,其对应产品即梦AI的文生图效果一度出圈。

不过,相比大语言模型,行业内多模态大模型的发展程度还远远不够。用姜大昕的话来说,“多模态模型领域,目前还没有出现GPT-4时刻。”

在姜大昕看来,它的卡点就在于整个行业缺少多模态领域的理解生成一体化架构。大语言模型已经做到了,但多模态大模型的理解和生成仍然由不同的模型完成。对于计算机视觉来说,这是一个几十年没有解决的顽固问题。

对比大语言模型的ChatGPT和推理模型DeepSeek-R1,多模态领域仍有机会等到下一个爆款模型。

走向AGI,什么是必经之路?

在AI应用落地如火如荼、Scaling Law边际效益递减的今天,继续押注基础大模型还有价值吗?

100天之前,DeepSeek的发布无疑给行业了一个无比确定的答案。

“一切变化都太快了,每天早上起来,新模型、新产品的发布都可能颠覆掉过往的认知。”一位创业者向光锥智能感慨道。

正如我们上面提到,这半年,模型发布的速度不减反增。同时,由模型能力提升带来的技术红利让DeepSeek们站到台前,而没有技术优势的公司则在投资热情退潮时,失去了继续立在第一梯队的机会。

为了更长久地留在牌桌上,无论是大厂还是创业公司,抢钱、抢人才,依旧是2025年的主旋律。

如今,算力、人才和资金仍然是衡量大模型公司立在牌桌上的三个硬指标。对大厂来说,资金自然不成问题,但对于创业公司来说,必须拉到足够的投资来为公司前期的研发买单。

以资金作为衡量指标,大厂自然相对充沛,但是初创阵营中只有“北京队”智谱和“上海队”阶跃星辰这两家被国资看好的企业,可以在大模型公司的寒冬期持续获得资本青睐。

以智谱来说,它在三月接连拿下杭州、珠海和成都三家国资的投资,累计共达到18亿人民币;去年12月,阶跃星辰拿到数亿美元资金,完成B轮融资。

再从人才衡量,目前“基模五强”正在展现对人才的虹吸效应。以字节来说,从2023-2025年,这家公司挖走了海内外的多位研发骨干,比如曾任谷歌DeepMind研究副总裁的吴永辉,今年加入字节成为大模型团队Seed的基础研究负责人。

在大量堆积资金和人才的基础上,上述基模五强逐渐建立了优势:“开源卷王”阿里用生态拉拢B端用户,字节则一边补齐基础模型的版图,一边靠豆包、扣子等应用反哺模型升级,DeepSeek靠性能和低价成为性价比之王,智谱的大模型落地在政企端优势明显,阶跃则成了“多模态卷王”,发出多款SOTA模型。

上述企业的目标都是继续提升大模型的“智能上限”,用溢出的模型能力支撑AI应用的能力突破。

以智能体(Agent)来说,其关键能力在于多模态、慢思考以及记忆能力。

有了多模态理解能力,才能让以大模型为技术底座的Agent能够“阅读”并理解手机和电脑屏幕中的信息,从而让AI也能够代替人类操作智能终端;而推理能力则让AI能够根据用户需求拆解任务,按照每一个规划好的步骤推进,最终完成任务。

Google DeepMind CEODemis Hassabis认为,目前通往 AGI 的道路已经开始变得清晰,但要真正抵达这个目标,仍需要突破多个技术瓶颈,整合多项关键能力。

在有限的时间内,谁的硬指标更全面、基座模型能力更强,谁才能有机会真正获得AGI的入场券。

大模型商业化趋势:开源、垂类场景落地

商业化是基础大模型公司不能跳过去的命题,其商业化的策略,往往和技术的战略也一脉相承。

2025年,开源和垂类场景应用成为模型商业化的两个关键方向。

先来说开源,开源的中国大模型已经在全球占据了半壁江山。目前,在开源社区HuggingFace上,前30的热门模型,已经有12个模型来自于中国公司,其中出现了阶跃星辰最新的音乐模型ACE-Step、DeepSeek的R1和Prover-v2、阿里的Qwen3系列、字节Seed的小参数代码模型和腾讯混元的AI视频模型。

开源之后,大模型公司可以尝试的商业化手段变得更加多样:国内以DeepSeek和阿里作为代表,采用的是更加开放的协议,这种模型一般可以走三种模式,最直观的是调用API付费,云厂商则通过提供GPU服务收“水电费”,另外,围绕开源模型的定制化调整和技术服务也是一种模式。

不过,真正能直接使用开源模型的企业和个人都是少数,多数人更需要一个“开箱即用”的完整产品。所以,AI在垂类场景的应用越来越火热。

最火热的无疑就是各行各业的智能体(Agent),从政企、金融到医疗,智能体可谓无处不在。但目前热度更高的,还是智能体和智能终端的结合。

为什么智能体+智能终端成为了关键的落地方向?

“汽车不仅具有高价值的软硬件系统,还与用户有着密切的联系,这使其成为理想的AI载体。”长城汽车CTO吴会肖说。同样,这条规则也适用于手机、具身智能等产品。

而对于厂商来说,和多模态、强化学习能力等相同,做Agent,同样也是大模型企业通向AGI之路的基石之一。在OpenAI给出的AGI五阶段来说,Agent对应的就是L3阶段,即AI拥有自主操作能力,在L3的基础上,AI才能进一步追求自主学习的能力。

所以,对于大模型公司来说,做Agent的商业化战略就是在技术基础上延伸而来的一步棋。

阶跃星辰和智谱,这两家大模型的南北双雄,也不约而同地都瞄准了智能终端赛道。

智谱在去年就推出了能够在手机端运行的智能体AutoGLM,让Agent接管各种应用调配,实现用户需求。

而在今年,阶跃星辰进一步扩大了Agent在智能终端的落地范围,在2月份的开放日上,这家公司放出了Agent在汽车、手机、具身智能、IoT四个领域的应用。

如今,各家大模型公司都在抢夺智能终端客户的订单。以阶跃星辰来说,在今年拿到了和OPPO、千里科技、吉利汽车集团、智元机器人等厂商的合作。

Agent能力的叠加,也在成为智能终端产品的卖点。比如,搭载了“一键全能搜”、“一键问屏”的OPPO手机Find N5和Find X8销量亮眼。据悉,其中Find X8成为Find 系列史上同期销量最高的产品。

比起其他业务来说,智能体+智能终端的合作,也为企业带来了可观的收入。据《智能涌现》报道,随着三星等大单的签订,智谱节后不到一个月,收入已经过亿。

从这一代AI大模型公司的商业化来看,大家都在避免传统ToB赛道重复造轮子的私有化定制,希望借助技术的红利,把产品尽量做得标准化,以此来实现更高的毛利率。

无论是提供开源工具的“自助火锅店”,还是垂类智能体的“私房菜餐厅”,大模型商业化的前景都在变得越来越乐观。

特别声明
本文为正观号作者或机构在正观新闻上传并发布,仅代表该作者或机构观点,不代表正观新闻的观点和立场,正观新闻仅提供信息发布平台。
最新评论
打开APP查看更多精彩评论

微信扫一扫
在手机上浏览