国产AI六小虎已经有俩变小猫,他们活下去的理由不好找
昨天,是国产AI六小虎之一百川智能成立的两周年,CEO王小川发布全员信强调公司方向:“减少多余动作,专注医学方向。”
要知道,两年前,百川智能刚成立的时候,其愿景可是“旨在打造中国版的OpenAI基础大模型及颠覆性上层应用”,非常宏大。
无独有偶,国产AI六小虎之中的零一万物的创始人李开复,今年1月在与媒体“连线Insight”对话时表示:“零一万物全面转向‘小而美’。”
而在零一万物刚成立的时候,其愿景则是宏伟的“打造AI 2.0全新平台,加速AGI到来”。
曾经的雄心壮志和现在战略收缩,让外界不少人调侃“小虎”已经成了“小猫”,那么,在AI大模型市场风云变幻的现在,这些地位不稳的曾经的“虎”,如何找到活下去的理由呢?
为了探究这个问题,知危编辑部找到了大模型技术专家、头部金融企业AI专家、头部医疗AI专家、一线大厂AI技术专家等多位专家进行对话,探究大模型企业们面临的问题以及如何更好的活下去。
表面上,今年春节DeepSeek爆火之后,整个大模型市场开始战战兢兢。它像是武松,几碗酒下肚给还没发育完全的“小虎”们打得头昏脑涨,一众大模型公司从最初斗志昂扬地同场竞技,转变到现在面对现实各自选择了不同的命运。
但其实,这一变化比人们以为的时间节点发生的更早。
大模型技术专家、《知识图谱大模型》作者王文广告诉知危:“实际上,甚至还不到DeepSeek V3和R1的发布,在DeepSeek V2.5和阿里的Qwen 70B推出来的时候,国内有些大模型公司就已经开始放弃训练大模型了,成本实在太高。他们感到无论在资源还是性能上都赶不上或拉不出距离,何况对方还是免费开源的。”
某人工智能技术服务企业专家梁贺(化名)则告诉知危:“大约2024年年中的时候,六小虎虽然还在训练大模型,但投入力度已经明显不如以往。”
直到2025年1月DeepSeek R1发布的时候,大部分中小企业发现彻底跟不上了。
这样的剧变,导致六小龙集体从攻关AGI,转变为了现在的开始分流。
百川、零一万物放弃预训练大模型,分别押注医疗AI和全面行业落地;MiniMax收缩To B业务,并专注C端视频生成等场景的海外市场;智谱、月之暗面、阶跃星辰在开源社区依然活跃,但并未有能超越DeepSeek R1的新模型;获得大量融资和政企合作订单的智谱不愁生存;因为效果远不如开源而放弃了投流策略的月之暗面,其头号产品Kimi因为元宝的后来居上,在定位上正显得尴尬。
总体来看,六小虎与国内市场中“最没有想象力”的一部分即To B SaaS市场,交集越来越大。
那么,为何To B市场如此“无聊”?
近期,零一万物宣称要全面接入DeepSeek,将企业大模型一站式平台在各行各业落地。对此,业内普遍谨慎看零一万物的未来。
某金融企业AI专家姜绍(化名)甚至评价道:“零一万物基本上是转B端了,他们感觉是什么都想做,公司团队整体过于技术,但DeepSeek出来后技术上也看不出差距,商业化水平又比较一般。”
王文广则告诉知危:“大模型一站式平台的技术门槛并不高。”
对于该类产品的技术门槛的评估,王文广是有亲身体会的,“我去年大概花了半年的时间,自己一个人就开发了这样的平台,现在也在通过个人的方式在售卖。而且我觉得这个产品通过公司来做很难赚到钱,但个人经营的方式还能慢慢赚到钱。”
“现在行业内有不少To B企业,他们不做大模型,但是也会做大模型的业务,只是缺少一个技术平台。我就跟他们合作,价格可以压得很低,只需要四五万一套,中大型公司肯定做不到这么便宜的。”
“我现在开发的平台,叫做KAF,即Knowledge-based Agent Factory,就是基于知识图谱、向量数据库、搜索引擎,通过检索知识来提供大模型和Agent应用的平台。目标是让用户可以不写任何代码,通过提示词管理和模型管理就能构建自己想要的知识助手或Agent。就这样的平台,市面上有非常多相似的,估计能有一千个,也很容易复制。”
“比如一家公司想做To B的大模型应用,即便创始人自己没有这个能力,要想做出产品也很快。无非就是招两三个特别牛的人,当然领头人必须很厉害,不然可能没法入手。这种方式的成本会比训练大模型的成本低很多。即便是行业里的大牛,年薪千万也差不多了,再加上两三个年薪百万的,就能组成核心团队。实在不行,还可以找外部的AI公司合作。”
除了上述模式,还有“企业大模型一站式平台”的模式,属于一体机的类型,对于这类产品,平安保险技术平台组负责人张森森认为,“一体机有足够市场空间,但一体机是卖服务的,跟技术没有太大关系。”
“一体机就是将核心硬件、软件、执行环境进行打包,达到开箱即用,主要面向技术部署能力较弱的机构,比如政府、教育机构等,也有一些企业客户,要点在于方便使用和技术自主性。当然它也有自己的优势,比如数据安全、隐私合规,因为它是私有化部署,面临监管的时候更容易通过安全审查。并且一体机是软硬件深度优化的,对于推理专用的芯片、端侧芯片,响应速度更快。还有另外一种考量,比如一体机对于国产芯片做了深度定制,从而绕过一些底层限制,提高效率。有些企业倾向一体机,是因为对成本比较敏感,更关注ROI,一体机的使用寿命更长,对于做财务报告的ROI可能更好一些。”
实际上,过去多年以来,无论在任何具体的领域,包括大数据、云计算、计算机视觉等,国内SaaS市场都有非常相似的特点,或者说这是各个领域最终会发展成的固有形态,包括定制化需求较高、产品偏向通用和同质化、市场竞争激烈、低价策略普遍、资本更关注短期变现等。这些SaaS企业的客户数字化程度较低,付费意愿较弱。
相比之下,海外SaaS市场更注重专业化分工,企业专注于特定领域,提供深度服务,以大中型企业客户为主,付费意愿更强。
大模型领域也正呈现这样的特点,我们可以参考近期海外SaaS市场的重要事件:
·
2025年2月,MongoDB以2.2亿美元的价格收购Voyage AI,后者是一家刚成立17个月,专注于嵌入(Embedding)和重排序(Reranking)模型的AI初创公司。
·
·
2024年,亚马逊宣布与成立两年的AI Agent初创公司Adept达成技术授权协议,Adept部分成员将加入亚马逊支持AGI团队。
·
这些初创公司都通过专注大模型技术的一个细分领域获得了资本成功或企业发展。但在国内,这种事例几乎为零。据知危了解,不少中小型企业在发展自身技术和业务时,甚至还要时刻提防大厂也来“抢肉吃”。
基于自身在To B市场多年的行业经验,王文广向知危描述了这个市场的残酷性:“一站式平台产品肯定有市场,而且市场还很大,但是会非常碎片化。我合作的这些小公司规模都不大,他们的运营成本相比中大型公司是更低的,可以把价格定在30到50万之间,即便这样也可以赚钱。因为他们不需要考虑研发成本,只负责实施,能够覆盖人力成本就行。如此一来,就会把整个To B场景的应用服务价格压的很低,何况我参与的市场肯定不只有我在做。中大型创企参与的市场可能只能做大型的企业客户,那也会面临其它创企、传统集成商等竞争对手。即便是大厂,在To B市场的业务策略也都差不多,大厂还能有自己的大模型和品牌优势。”
“我也在用DeepSeek,还有大量其他企业也在用DeepSeek,那就没有任何差异化的地方。国内有多少云厂商,就至少会有多少个竞争对手。国内To B市场一直是这样,想要活下去,要么关系硬,要么服务好,要么价格低。”
梁贺向知危简要地评估了零一万物的当下选择和未来可能性:
·
李开复目前将零一万物的业务完全转向To B应用,主推企业大模型一站式平台,这个做法在商业上肯定是没有问题的,但是市场会很卷。
·
·
零一万物要做出比大厂更低价的大模型产品,其实也是没办法的事情,因为应用层面没有什么能够保持独特优势的地方。
·
·
零一万物转向To B,说明它AGI的想象力也就弱了,做的事情不够性感了。这跟2017年以来的上一波CV浪潮的视觉公司后来的结果很类似。
·
·
如果零一万物也做海外的市场,或许还有机会。
·
相比之下,业内对百川智能的未来,虽不算乐观,但也没那么悲观。
一方面,百川智能进军医疗,没有其独特的优势,特别是在数据方面。
姜绍告诉知危:“百川转向医疗,只是给自己找一条活路。但相比零一万物,百川至少是在尝试做一个细分市场。”
张森森表示:“相比科技公司,我更看好拥有医疗数据的公司做医疗大模型。这个对于任何想做行业大模型的公司都是同样的道理。因为做医疗大模型的关键难点不在于大模型,而在于数据。中国有那么多好的医院,医院也可以自己用DeepSeek微调出一个大模型出来自己用。”
如何有效地获取医疗数据?姜绍表示:“AI技术创业公司在数据上没有优势,如果想做医疗大模型,可能需要和原本就在帮医院做信息化的公司去合作才行。”
而据知危所知,六小虎中已有公司跟国内大型医生交流论坛进行独家合作,利用该论坛中医生交流产生的大量案例对模型进行训练。
除了对细分市场相对乐观,另一方面,业内对百川创始人王小川本人抱有希望。
梁贺认为:“王小川要专攻医疗,成不成,要看他是要做理想还是要赚钱。如果是要做理想,做出有突破性的医疗AI研究成果,那我更看好。从我对王小川的理解来看,他应该更倾向前者。”
王文广则强调了这个市场陈旧的一面:“如果是想短期内做商业化,那其实医疗这个赛道也是很卷的,和To B市场整体的情况没什么本质区别。商业化层面,用知识图谱、向量搜索加大模型来做医疗,很多公司都能做。”
据知危与医疗AI专家的沟通,医疗本身还有巨大的知识盲区,新知识在快速增长。因此基于大模型做医疗基础研究,有很大想象空间。以蛋白质结构预测的AlphaFold模型为例,据梅斯医学报道,截至2024年5月,全球已经有180+万的科学家使用AlphaFold加速研究,包括开发生物可再生材料,或推进基因研究等。
除了理想和赚钱,医疗AI创业还有一个主要争议点是:要不要、能不能做出通用医疗大模型。
对此,张森森表示:“通用医疗大模型目前在国内市场尚无明显突破,主要原因在于大规模数据的收集和应用依赖于强大的医疗设备支持。国内许多医疗设备还没有广泛普及,因此AI难以进行精准诊断。但一些综合实力强的医院,如海外的梅森医疗中心等,已经开始探索推出自己的大模型。尽管短期内很难看到盈利机会,但从长远来看,这类大模型有可能对医疗行业产生深远影响。”
“医疗行业还面临全自动诊断的挑战,尤其是在国内设备不足的情况下,AI无法完全替代传统诊断方式。部分医疗设备尚未普及,尤其在边远地区,医疗技术难以全面覆盖,因此全自动诊断仍然存在较大的难度。”
“由于医疗行业具有严格的牌照和合规要求,大模型在进入医疗领域时必须解决合规问题。未来的C端医疗服务可能通过结合医生技术和AI技术来提升诊疗效率,尤其是面向80后、90后、00后等年轻群体。”
最后,即便抛开国内To B市场本身的特点,单从大模型应用竞争的角度,To B市场的存活难度也相当大。王文广表示:“虽然整体上大模型To B产品的设计模式还在摸索中,但最终还是会趋同的。这方面不仅是国内,就连硅谷科技公司也类似,比如OpenAI、Anthropic、谷歌等,只要模型本身的性能拉不开差距,在这个市场里就一定不能赚钱,最后会卷到大家都处于同样的水平。”
“这也是为什么DeepSeek R1其实最大的影响力不在国内,而是在国外,特别是对硅谷科技公司。美股就是从R1发布开始持续高位震荡然后开始下跌。背后的核心逻辑很简单,就是硅谷的大模型被中国追上了。不能说超越,但是被追上了之后,硅谷这边拉不开差距,就无法支撑这么高的估值,于是股价就下跌了。”
当然,To B市场还有一种方式能够很好地吸引客户,那就是开源。企业开源的主要盈利模式包括额外提供收费级功能、云托管,以及基于开源技术的企业级咨询、培训等增值服务。
开源大模型最直接的作用就是推动技术的普及,张森森表示:“DeepSeek开源之后,对于企业在应用大模型上有非常大的加速作用。公司高层对大模型的应用是很支持的,随着大模型在实际应用中表现良好,尤其是在降低人工干预、提升效率等方面优势逐步显现,支持力度将不断加大。”
“金融行业作为数据质量最好的行业,在AI方面一直有丰富的技术积累,自然能够很快跟上。不管有没有DeepSeek,金融都会落地AI技术。但有了DeepSeek之后,除了过去AI赋能的金融主营业务,现在也会将AI用到一些日常办公、过去比较难做的运维等业务。”
“运维原本成本是很高的,比如对于根因分析,之前需要基于传统的运维监控和AIOps来做,也需要专门训练一些小模型来做,现在可以用DeepSeek结合知识库去生成应用方案,来处理监控、告警、自助分析,以及溯源、自动化处理、稳定性提升等工作,这比AIOps更加灵活。”
“其次,对于运维工作,AI的覆盖面也变得更广了,现在会更加考虑到交互性和主动性,主动性也就是让AI主动去做运维。从过去依赖规则、人工甚至个人经验,人的经验高低决定了运维能力的水平,现在可以用更加轻量级的AI模型来直接实现。”
“尽管DeepSeek的幻觉率依然较高,甚至与其它同类模型表现差距不大。但相比其它同类模型,DeepSeek的推理和实际应用能力已足以抵消幻觉带来的负面影响,我们会通过微调和优化,采用RAG等相关技术,将这一问题逐步改善。”
阿里大模型技术专家高鹏(化名)则认为,DeepSeek的影响力对大型公司和中小型公司的影响有所不同:
“阿里内部使用的大模型一直是业内最先进的,所以DeepSeek出来之后对我们的影响没那么大。我们会拿DeepSeek做性能评估和对比,对阿里而言,更多是技术上的启发。DeepSeek在Reasoning上的落地比较快,而技术细节上还是比较通用的,DeepSeek也肯定有受到千问的影响。”
“相比之下,DeepSeek对于中小型公司影响比较大,因为之前没有一个模型可以达到DeepSeek那样效果的同时,实现低成本的私有化部署。DeepSeek出来以后,也涌现了大量卖DeepSeek一体机的公司。但实际上,跟很多开源模型一体机相比,DeepSeek也不是最便宜的,要看具体的标准。”
无论怎样,现阶段国内开源大模型枝繁叶茂,并已经能参与全球竞争。然而,从平安保险自身落地大模型的情况,张森森认为开源大模型还有难以克服的局限性:
“对于我们而言,DeepSeek主要是成本上的巨大优势,在能力方面的话,比如在运维场景,在推理、泛化能力、上下文理解上可能比其它模型更好一些。但在金融风控等更复杂的场景下,DeepSeek的表现并不突出。这是因为需要更细致的微调,甚至结合其它模型进行优化。因此还需要根据具体应用场景进行针对性的微调,来进一步提升模型表现。”
“平安自研的大模型,主要分为两层,底层是基础大模型,再往上是分别负责银行、保险等业务等领域模型。我们内部使用的大模型在专业知识领域的表现确实超越了DeepSeek,尤其是在金融和医疗等特定领域,模型的表现更加精准。然而,在推理能力上,DeepSeek依然具备强大的优势。有一些场景,我们希望先用DeepSeek做一个小规模的尝试,看看能不能跑通。”
“对于阿里千问、百度文心和智谱ChatGLM这些开源大模型,它们在这方面与DeepSeek的区别并不明显。判断的依据是,这些模型在推理能力和知识库结构上与DeepSeek并无太大差异。”
综上来看,开源大模型的影响力目前还有限,并且它们彼此间追赶节奏紧张。
但To B竞争激烈,也不代表To C路线就更有希望。
大模型的To C产品竞争也是非常残酷,但相比于To B市场,又有很大的不同。
一方面,市场格局瞬息万变。
以海外市场为例,根据a16z发布的“Top 100 Gen AI Consumer Apps”最新报告(第四期),自2024年8月(第三期)以来,就有多达17家新公司进入了生成式AI Web产品的Top 50排行榜,比如国内的Kimi、海螺AI、DeepSeek等,其中DeepSeek尤为亮眼。
DeepSeek 在极短时间内强势崛起,其月活人数从几乎默默无闻到大大超越 Claude、Perplexity,只用了一个月的时间。
在移动端的使用时长方面( 基于平均每周每位用户的会话数和每位用户的分钟数 ),DeepSeek 也略高于Perplexity 和 Claude,但目前和 ChatGPT 相比仍有较大差距。
另一方面,To C的变现难度很大。
最受欢迎的应用并不一定能带来最多的收入。比如ChatGPT有最高的收入,OpenAI却仍然年亏50亿美元,而大量ChatGPT的“山寨”应用倒是很可能实现了快速盈利;DeepSeek火了以后,模仿者、仿冒者也是排山倒海而来。
从C端市场来观察六小虎的境遇,实际上也不乐观。综合知危与业内专家的沟通,普遍认为大厂将带来极大生存压力。
姜绍表示:“消费市场方面,六小虎里面做的比较好的是月之暗面的Kimi。但现在排第一的是腾讯的元宝,第二是DeepSeek,第三是豆包,头三家公司几乎占据了大部分市场份额。腾讯的元宝凭借微信生态圈获得了大量的客户流量,而DeepSeek则凭借其技术创新和在多个场景中的优异表现脱颖而出。”
梁贺表示:“Kimi的大模型技术和竞争对手没有太大区别,那就只能免费,这就导致月之暗面商业化变得特别困难。作为一个To C应用,看不出它跟元宝、豆包的区别在哪里。而且,豆包可以用字节其它业务来养,元宝可以用腾讯其它业务来养,它们可以投入1000亿来养这些应用。”
姜绍补充道:“对于C端用户,更加关心产品易用好用,腾讯和字节在这方面做得更好。当然阿里也有机会,阿里正在孵化名为‘AI听声’的应用,这个应用通过AI进行聊天和交互,目标是取代抖音在短视频平台中的地位。虽然抖音吸引大量创作者生成优质内容,但AI聊天应用通过提供更加个性化和互动的体验,有潜力在一定程度上吸引用户群体。两者的差异主要在于内容创作和互动方式。如果阿里能够突破这一块,也有机会翻身,当然如果腾讯跟进仿制,就不好说了。”
对于MiniMax,业内的看法稍微有些不同。
梁贺认为:“MiniMax的海螺AI目前是挺赚钱的,它算是找到了自己的一条路,但这条路能不能让MiniMax的估值做的足够大,还是个未知数。由于偏向应用,MiniMax在DeepSeek出来之后更轻松了,如果他们全部使用DeepSeek的模型,反而是节省了模型的研发成本,而它的应用还能继续赚钱,甚至赚的更多。”
姜绍则认为:“MiniMax如果后面能够做出一个爆款APP的话是有机会的,但阿里可能会超过它先做出爆款APP,所以MiniMax即便有机会概率也不大。”
究其根本,产品差异化依然是C端应用的突破口。
根据a16z的“Top 100 Gen AI Consumer Apps”最新报告,许多使用率较低的应用其实实现了更好的收入。有些通用性很差的产品比如植物识别、营养等吸引付费用户的能力反比通用产品而更大。
做通用的AI产品,很难打出差异化,用户付费意愿低,盈利周期长,所以熬不过大公司。
而做差异化如果垂直深度不够,也容易被基座大模型通过能力升级所内化。比如,最近GPT-4o的生图能力就对Midjourney等文生图创企带来了降维打击。这种覆盖能力,很多时候都是随机的、不可预测的,正所谓“毁灭你,与你无关。”
竞争对手的像素级模仿,基座大模型的快速升级,让C端AI初创公司的风光几乎永远只保持很短的时间。
至于如何抓住这极低概率的成为爆款的机会,业内专家一致认为“基本上还没有经验可循”。
六小虎走入今天的困境,很大一部分是因为当初在基座大模型上投注过大,低估了要在这个赛道上生存和拔尖需要的人力、财力、物力,导致现在在应用赛道上也很难打出差异化。
如今六小虎对攻克AGI的决心越来越弱,李开复近日还公开直言,国内的基座大模型最后只会剩下DeepSeek、阿里、字节三家。
对此,与知危交流的业内专家也基本同意这个看法。
姜绍表示:“现在还在继续死磕大模型技术的创业公司基本都得死。最有希望的肯定是DeepSeek,第二是阿里巴巴,第三是字节跳动,第一名预计能分到50%-80%的流量,后面两名可能分到10%的流量。核心在于谁先把AGI做出来,谁就是最后的赢家。”
“DeepSeek目前在大模型领域最具竞争力,其技术创新和在实际应用中的表现无可挑剔。阿里巴巴和字节跳动也具备较强的竞争力,尤其是在跨平台应用和数据资源上的优势。排名的依据主要是基于各家公司在基础技术、算力、数据资源以及实际应用中的创新能力。”
“智谱和Kimi的团队坚信,继续增强基础模型的能力才是未来的出路。与之相对,我认为随着市场需求的变化和应用场景的多样化,单纯强化基础模型的路线可能会受到局限,更灵活、适应性强的模型发展路径才可能更加具备市场竞争力。”
“大模型技术竞争异常激烈,投入巨大的公司最终必须在创新、算力、数据和优化上有明显突破,才能保持竞争力。其他未能跟上技术进步或无法应对市场需求的公司将逐渐被淘汰。”
梁贺表示:“国内的基础大模型公司未来只会剩下DeepSeek、阿里、字节三家公司,依据就是这三家能够有实力和决心投入超大资源来研发。对于字节而言,它不可能错失大模型这个机会,不然对它整体影响会非常大。而且DeepSeek的技术对于字节而言不会有太大的壁垒,更多是研发效率上DeepSeek目前更有优势。阿里的千问开源模型本身水平比较高,在DeepSeek火起来以前,千问和Llama基本是你追我赶的状态。对于阿里来说,千问模型可以不赚钱,但是相关的云业务可以赚钱,字节也是类似的,还能将大模型技术不断用于优化抖音等App的体验。而对于AI创业公司,如果模型本身不赚钱,就触及了生存的根本。”
王文广则表示:“DeepSeek的优势主要在于技术理想主义。春节前后两三个月内,DeepSeek的流量巨大,如果它想做商业化的话,很快就能达到全球第一,豆包等其它大模型根本没有机会。只要DeepSeek不在最近的开源周把基础设施相关的优化方法开源出来,以后它都可以依靠这个来赚钱,如此一来别人都没有机会。DeepSeek也没有融资,不需要受到投资人的影响。技术理想主义和人才是最大的壁垒。对比OpenAI,OpenAI现在能看到的成果基本上都是在Altman和Ilya的纷争发生之前的研究成果,至少创新点是已经确定了,如今最初那帮有理想的人才离开了之后,OpenAI本身的创新几乎就没有了。目前OpenAI的创新更多是在应用层面,比如Deep Research,应用层面的创新没有什么壁垒,所以它也要跟着竞争对手一起卷。”
某大厂AI技术专家王牧(化名)告诉知危:“除非有钱、有人才、有硬件,否则没必要在预训练大模型上浪费功夫,DeepSeek起码在2021年就有万卡集群了,也不缺钱。反观其它中小公司,基本凑不齐这个条件。”
高鹏表示:“AI创业公司要想活下去,还是要转向应用,一两年前我也是这么认为的,现在转都可能太晚了。接下来第一批要被淘汰的AI公司就是做基座大模型的公司。大模型的训练,其实有很多复杂的细节,非常依赖经验的积累。Transformer架构内部的细节是普遍比较了解的,但不管开源还是闭源模型的论文基本都不会告诉你数据是如何准备的,数据细节是什么,数据规模有多大,数据质量如何等等,业界也没有一个统一的标准。”
“开源开一半”在大模型赛道一直是典型做法,当前,会将代码、权重、数据集、训练过程全公开的大模型少之又少,比较知名的有OLMo、BLOOM等。
然而,即便转向应用就能活下来了吗?从前面对To B赛道和To C赛道的分析,AI创业公司在应用上几乎很难形成自己的行业壁垒。对此,高鹏表示:“要想形成自己的行业壁垒,关键在于自己拥有哪些数据,模型谁都能用。数据分为两个方面,一方面是创业者的领域经验,一方面就是手里的数据了。”
从企业文化的角度,高鹏认为研发基座大模型需要的是一种实验型、工程型的艰苦探索精神,“之前很长一段时间,国内很多AI创业公司都太高调了,做技术本来是先应该低调的做,做好再去高调地宣传。有些团队学术界的组成比较重,但学术界的人研究技术有时过于理论化。人才或团队方面,一个大模型团队能不能成功主要看老板理不理解大模型。如果老板都不理解大模型技术,或者没有信仰去坚持,因为不赚钱就放弃了,是根本行不通的。DeepSeek能成功更多是依靠自顶向下的组织模式,老板对技术细节很懂,带大家一起干。国内符合这种模式的太少了。”
对于业内热烈讨论的国内基座大模型最后的赢家预测,高鹏认为这个论断还太早,“能参与竞争的玩家,技术路线上不会有太大的差别,就按着Transformer架构去做细节优化就行,Mamba和RWKV也有希望。关键是要踏踏实实做事,时间会证明一切。最后的赢家、前三名这种事都不好说,大模型技术栈是很复杂的东西,而且谁知道是不是还有很多人在默默地干一件事情,只不过时间还没到而已。”
在模型赢家很难判断的现在,数据开始变成了最重要的护城河。红杉资本合伙人Konstantine Buhler曾表示,OpenAI在ChatGPT上犯的一个错误就是不允许编辑回复,而这本来可以在反馈循环中提供更高质量的数据,并构建更深厚的护城河。
数据能否让某个行业在当下借助AI进一步发展或者带来新的商业机会也很重要,张森森表示:“AI落地的成熟度更加接近金融、互联网两个行业的,我比较看好AI办公、AI政务、AI电商。主要是基于其数字化程度高,以及业绩的高确定性。”
“尽管电商已经比较成熟,但AI将继续提升电商的效率,尤其是在商品推荐、客户服务、物流优化等方面。AI通过更精准的市场分析和决策优化,能够提升电商平台的效率。这种效率的提升将不仅仅是线下零售的继续,而是能带来新的电商形态,尤其是在跨境电商领域,AI将助力其爆发式增长。”
“相比之下,金融行业在2024年就出现了一次业绩爆发,2025年随着AI业务深入,业绩能还有很大的增长空间。”
“反观那些AI落地不成熟的行业,特别是智能制造,有大量的定制化的东西,每个企业生产的产品都是不一样的,没有一个统一的标准。所以企业想推动AI工作自动化比较困难,数据的价格很高,精度要求也很高。虽然说工业软件基本是智能制造落地最早的解决方向,有比较好的效果。但是制造业的AI化升级是有历史包袱的,大部分的制造行业的数据和信息化的水平是不够的,就导致它们在做AI化的时候是缺乏数据的,特别是异常样本的收集几乎是没有的。复杂度也高,比如设备种类繁多、数据标准不统一,导致算法可迁移性很差,常常忽略一些关键因素比如温度、材料或者一些不可预测的变量的影响。而且,企业对传感器数据的关注是有偏差的,对于各种传感器故障数据,企业主要关注的是会影响生产结果的数据,但实际上,那些边缘的传感器数据,未来很有可能成为我们撬动整个制造业创新和商业化的一个支点。AI能够通过对这些数据的分析,发现潜在的优化机会,从而推动整个行业的进步。”
“而且,制造业的能力要求和其它行业也有一些不一样,它要求必须实时处理问题,大模型的延迟性在这里会难被接受。所以,智能制造短期内是没有投资回报率的,当然国家肯定会把这个行业的AI化给扶持起来。可能未来五年,会产生一个大规模增长,机器人化和AI化会做一个双重结合。”
说到底,对于初创公司来讲,无论是做基础大模型还是做To B或是To C,你都很难找到一个坚固的护城河,如果没有长年积累的数据或技术经验,都无法形成竞争壁垒。
所以,初创公司一旦没有在小有名气的时候把雪球滚起来,很容易就逐渐落寞最终找不到活下去的理由。
他们在某一刻摘到金苹果时,不过是命运女神短暂地打了个盹。
