“AI拜年”火遍朋友圈,营销的终局是拼技术
题图由文心大模型4.0 Turbo生成
每年春节前夕,都是互联网营销的关键阵地。
2025年也不例外。有别于红包、集福等常规玩法,越来越多的企业开始用AI“花式过年”。
比如百度搜索的“春节祝福语”活动,只需一张照片和一句文案即可生成一张喜庆的拜年贺卡,吸引无数人在朋友圈中秀创作、送祝福,用一种个性化十足的方式点燃了春节的热闹氛围。
01 “AI拜年”走红,密码是没有“AI味儿”
时间回到2023年初,AIGC的热潮刚刚被引燃,一些“聪明”的企业顺势抓住了“新春祝福”的流量风口,让AI帮用户生成祝福海报。
最终却未能出圈,没有在互联网上留下太深的记忆。
原因很简单,这样的海报有一股浓浓的“AI味儿”:文案看似辞藻华丽,但几乎没有什么意义,有些甚至简单粗暴的复制网络内容;生成的图片,无法避免一些常识性错误,比如生成的兔子是没有尾巴的。
为什么百度的“AI拜年”非但没有翻车,反而成就了一种新玩法呢?在回答这个问题前,先来体验下百度的“定制照片贺卡”。
首先在百度APP上搜索“春节祝福语”,进入到拜年的活动页面,找到“蛇年专属祝福”的服务。
进入到定制页面后,上传一张正脸照,用于定制专属照片贺卡。
照片上传后,输入一句话作为Prompt,比如画一个图中人在太空舱内挂中国结、画一个图中人在海底餐厅中与鲨鱼共享年夜饭、画一个图中人在长城上拉横幅写“新年快乐”、画一个图中在月球表面上撒红包……当然,也可以直接使用推荐的描述。
然后静静等待奇迹发生。
【我们用不同的提示词,生成了一组拜年贺卡,祝阅读本文的各位读者蛇年大吉大利。】
让我们惊讶的是,生成图片中的人物和上传的正脸照相似度高达90%以上。不仅没有出现张冠李戴,从整体到细节都可以用“逼真”来形容,几乎看不到“AI味儿”。
前面的问题,已然有了确切的答案。
一是更有“文化”。
有别于市面上形形色色的文生图类应用,百度实现了特定人物的图像生成,不仅懂技术,而且有“文化”。在中国的文化习俗里,春节的寓意绝不是表面上的贴春联、放鞭炮、吃饺子,而是团圆和祝福。拜年贺卡的“主角”定义为用户自己时,有着别样的情感,直接将“年味儿”拉满。
二是更加真实。
上述六张照片都是AI生成的,可以说毫无违和感,没有变形的手指,没有出现诡异的物品,而是完美还原了背景和人物的秒不特征,终于摆脱了“一眼假”的尴尬。(当我们把同一指令测试其他文生图应用时,生成的图片几乎看不到原图中人物的影子,而且每次生成的人物都不一样)。
做一个总结的话:AI给出了“拜年”新思路,精髓不在于形式上有多“花哨”,而是用技术弥补缺失的年味儿。看似是比拼创意的营销战,背后却是技术和创新能力的对垒。
02 “好玩”的背后,离不开iRAG技术
一个好的创意能否出圈,存在很大的偶然性;一项新的技术能否流行,在于解决了多少问题。
两年前ChatGPT横空出世,生成能力的进化刷新了人们的认知,但“一本正经地胡说八道”时有出现。这种现象被称作是“幻觉”,如果不能把“幻觉”出现的概率降到足够低,大模型就无法真正从“好用”变成“有用”。
消除“幻觉”的主流技术,正是RAG(检索增强生成),基本思想是通过从外部知识库中检索相关信息,并将这些信息作为额外的上下文提供给大模型,以提高生成内容的准确性和实用性。
文本生成的“幻觉”问题终于有了解题的方向,文生图的“幻觉”又该从何处着手呢?
2024年11月的百度世界2024大会上,百度创始人李彦宏在主题为《应用来了》的演讲中发布了一项赋能AI的技术——iRAG,摸索出了一条消除图像“幻觉”的可行路径。
iRAG技术可以看作是一种全新的检索增强文生图范式,将百度搜索的亿级图片资源和文心大模型的生成能力结合,实现了对用户的需求和真实世界的场景进行对齐,然后生成符合现实的图像。
作为一种纬度上的探索,iRAG通过提升系统复杂度,进一步提升了生成内容的可靠性,并赋予了文生图更大的实用性。
还是以“拜年贺卡”为例,本身并不是什么新创意,许多年前就有一些娱乐明星在春节期间给粉丝发祝福贺卡,不乏热搜级别的话题。然而,这样的祝福海报,需要一支专业的摄影团队,需要打光、调色、后期等一系列分工,成本高、耗时长,而且要来回沟通修改。
无幻觉、超真实、没成本、立即可取的iRAG,让“技术平权”成为了一种现实:在春节这样的传统节日里,普通用户也可以发挥自己的想象力,只需要上传一张照片,等待几秒钟,就能生成一张张有趣的“拜年贺卡”。过去专业团队才有的能力,“飞进了寻常百姓家”。
也就是说,拜年贺卡之所以没有“AI味儿”,iRAG技术有着不可或缺的作用,同时也通过一场面向亿万用户的“大练兵”,验证了iRAG技术在多模态融合、低门槛交互、场景泛化等方面的能力突破。
以往不少人对iRAG的理解,可能仅仅停留在了概念阶段,经过“AI拜年”的营销杠杆,无疑让更多人深切感受到了图像生成的另一种可能。
毕竟大模型浪潮已经持续了两年多,早已从对技术的“好奇心”转向大规模应用,而“幻觉”正是制约大模型应用落地的一大绊脚石。大众认知被刷新的同时,也为AI作为生产力工具铺平了道路。
03 更大的想象力,在于产业化落地
2024年初的时候,国外就有导演推出了全部素材均由大模型生成的短片,吸引了不少人的眼球。
可一年时间过去后,几乎看不到大模型参与的影视作品出现,正在上映的院线电影,没有一帧是大模型生成的。原因并不难解释,那部由大模型生成的短片,前后花费了3个多月进行制作,进行了大量的剪辑和拼接,成本远高于传统生产模式。
原因无他,任何技术和“生产力工具”挂钩后,准确性和可靠性始终是产业化落地的第一要义。
就现阶段而言,市面上比较流行的几个文生图应用,在很大程度上偏向“抽象的、超现实主义的艺术家”,对现实世界缺少了解,生成的图片天马行空,却和实用性存在本质矛盾。
iRAG是怎么降低幻觉的呢?百度CTO王海峰曾在媒体采访中将技术原理拆分为三步:
第一步是对用户的需求进行分析理解,自动规划精确或泛化方案,比如对哪些实体进行增强;
第二步是对需要增强的实体,检索并选择相应的参考图;
第三步是生成图像,使用了百度自研的多模可控生图大模型,通过注意力计算,在保持实体特征不变的情况下,实现了图像的高泛化生成,比如根据牛顿的肖像,生成绘本风格的牛顿(在实际落地应用中,iRAG也支持用户上传参考图,生成用户期望的图片)。
打个比方的话,iRAG将大模型从追求炫酷的艺术家,变成了严谨、靠谱的“美工”。追求的是提供可靠的解决方案,瞄准的是产业化落地,让技术真正能够服务于生产。
【PS:为了验证iRAG的“美工”能力,我们使用文心大模型4.0 Turbo生成了一组“恶搞图片”。】
相较于To C的“意识流”产品,iRAG可能不是最引人注目的选择,却抓住了产业化的核心症结。
比如每天要出具大量效果图的建筑设计企业、处理海量产品图片的电商企业、面临大规模创意素材产出压力广告企业、批量生成样板间效果图的装修设计企业......他们需要的是标准化的内容生产,而且要稳定输出、行为可控,恰恰也是iRAG着力解决的问题。
这让我们想到了电灯的进化史:早在19世纪初,戴维·汉弗里就在课堂上演示了电流通过白金丝发光的现象,20年后诞生了由白金丝制成的炽光灯泡,直到爱迪生1879年研制出碳化纤维作为灯丝的白炽灯,可靠性和成本之间有了最优解,世界才慢慢被照亮。
沿循这样的逻辑,iRAG可能就是改变行业走向的那根“灯丝”,解决了图像生成的可靠性,同时给出了无法被拒绝的成本优势:譬如在品牌宣传场景中,拍一组汽车在某场景下的宣传海报,动辄大几十万,现在有了iRAG,只需要一句提示词,创作成本接近于0。
由此可以预见,建筑设计、广告策划、品牌传播、影视娱乐......所有涉及到图像制作的行业,都可能在iRAG技术的赋能下降本增效,在产业端释放出诱人的想象空间。
04 写在最后
两年前大模型刚走红时,没人想到会改变什么,现在已经逐步在各行各业落地,持续迸发出新质生产力。
也许两年后再来审视2025年初的“AI拜年”热,被记住的将不仅仅是“好玩”,而是iRAG走向千行万业的标志,届时将有50%的视觉设计基础工作都iRAG参与完成,连煎饼摊的老板都能设计出自己的个性化菜单。
在大模型的起始阶段,每一个创新都有可能开辟出一条前人未曾涉足的道路,iRAG的探索才刚刚开始。