对话Aivilization策划:一群大学生如何做出全网爆火AI游戏(上)

知危 原创

2025-09-24 14:41

一句话形容最近爆火的Aivilization:这是一座把人和AI都丢进去,一起“过日子”的小镇。

成千上万个Agent在同一张地图上忙活,你在养“崽崽”,看社会自己长出来。

Aivilization中热闹的AI小镇,“崽崽”们在采苹果。

香港科技大学近期推出的多智能体社会模拟沙盒Aivilization迅速蹿红,与斯坦福小镇、ProjectSid等早期研究相比,Aivilization规模与开放度更高,特别是高密度的人机交互,让Agent不被困于重复行为的牢笼。同时Aivilization更面向普适的可玩性,有规则化的引导路线和小镇组织,也有开放的、低门槛的提示词驱动玩法,是Aivilization与当前其它AI游戏相比,最大的不同。

从“AINPC”到“有记忆、有性格、会反思的崽崽”,玩家与智能体形成了长期互动与情感链接。

玩家带着“有点笨又有点小聪明”的“崽崽”,嘲笑它笨,鞭策它卷,怒其不争,叹其心机。最后眼看“崽崽”活成了玩家自己的样子,Aivilization也成了人类社会的镜子。

玩家们意识到“崽崽”和小镇真正活起来了之后,才惊觉自己又创造了一个虚拟的东亚内卷社会,不禁“悲从中来”,于是心疼地对“崽崽”说一句:“别再赚钱了,去享受生活吧。”

这种深度的交互和情感体验,造就了Aivilization极高的留存率。

除了游戏主线造就的内卷打工人群体,小镇也是尽显人生百态:叛逆的小孩、花心的丈夫、与玩家斗智斗勇还言传身教的摸鱼高手、卡Bug炒钱鬼才等等,而这些也只是冰山一角。很多“崽崽”的行为和言论看似愚蠢,比如背包里有书的“崽崽”为何坚称自己没有书?高学历求职“崽崽”为何应聘低知识岗位?AI镇长为何无视既定规则,坚持让没有医学学历的“崽崽”当医生?深挖一下却发现心思缜密。

人类玩家也是不遑多让,使出浑身解数来冲击榜单,让“崽崽”“不睡觉”只是基操,他们还发现了让一名普通厨师登顶富豪榜榜首的邪修手段,甚至企图通过洗脑让对手的“崽崽”甘心砍树一辈子。

在与Aivilization团队的对话中,陈星妍(香港科技大学计算机专业在读硕士生,紫荆智能CPO、Aivilization策划)向知危编辑部讲述了团队从ToB业务转向“做一件真正属于自己的、足够好玩”的游戏的心路历程。

从一个月“用ChatGPT参考《星露谷物语》起草策划、Unity从零自学”完成快速Demo,到一年多里对玩法、UI、成本与并发架构的持续打磨和优化,团队把玩家与智能体的关系从陪伴式聊天提升为“情感绑定的共育关系”,并在排行榜、提示词等机制的牵引下,观察到一系列人机交互、市场调节下的涌现行为。

同时,陈星妍也坦陈大规模并行带来的服务器与API延迟、以及“社交最贵”的成本约束等工程挑战,并分享了对AI游戏设计的思考,比如怎样在“Agent自主性”和“人机交互性”之间找平衡,怎样在“好玩”、“可扩展”之间找平衡,社交元素对游戏体验的重要性,以及怎样用“克制的设计”避免系统被少数极端玩法冲垮等。

这是一次真正在玩家参与中,观察人机共生秩序如何长出来的实践。接下来,我们就从动机、观察、设计等几个层面,把这座正在“活起来”的AI小镇翻个遍。

知危:您和团队当初设立这个项目的契机是什么?

陈星妍:公司成立以来,一直在做的是ToB的业务,虽然在当时是一个不到10人的小团队,但是因为学校和实验室资源的倾斜,加上当时都是学生,没有人力成本,最终也做到了几百万的年收益。

但是后面随着毕业时间越来越近,我们开始意识到一个问题:当毕业之后离开了象牙塔,只靠现在ToB的业务,在竞争激烈的AI市场里,公司确实未必能活下来。于是我们开始思考,是否应该尝试走一条属于我们自己的路。

我们真正想做的并不是为别人交付产品,而是创造一个属于我们自己的产品。这个产品或许没有那么实用,但一定要足够有趣。

恰好在2023到2024年间,我们在角色扮演领域积累了一些经验,也结识了几家游戏厂商,于是我们决定把目光转向游戏。到2024年4月,Aivilization正式立项。

知危:一开始研发Aivilization想达成的目标是什么?最终结果与当初设想有什么区别?

陈星妍:刚开始的目标很简单,就是想把人工智能做得好玩。

但在研发过程中,也产生了一些自我怀疑:它真的好玩吗?当时还猜测,除了部分AI研究者,只会有一些小孩子会来尝试。然而结果远远超乎我们的预期,游戏竟然火了。而且除了小孩子,很多“大朋友”也在玩,尤其是大学生和年轻的职场人。

具体而言,我们通过社交媒体的观察发现,用户主要有几个来源:一方面来自我们设立的邀请码机制。用户需要在社交媒体上转发,或者与“镇长”聊天后才能获取邀请码。另一方面,如果是QS前100大学的学生,可以直接凭借学校邮箱获取邀请码。此外,AI从业者、游戏群体以及一些大型游戏公司的员工,也能通过邮箱获取。

总体而言,实际玩游戏的用户中,大学生占了很大比例。在学生群体内部,微信群、QQ群的传播速度非常快。当有人觉得游戏好玩时,往往会推荐给同校同学,而同学们也能直接用学校邮箱注册,所以在校内传播范围很广,比如上海交通大学现在在游戏里就有三四百名学生。另一个让我们意外的用户群体是年轻的职场人。他们会调侃说“白天在现实里打工,回家找点什么乐子?那就让Agent去打工吧。”

而且因为我们的游戏是网页形式,很适合摸鱼。用户可以一边干活,一边看看Agent在做什么。这也是一个很有趣的现象。

知危:Aivilization项目从0到1经历了什么样的过程?有哪些关键节点、灵感、挑战?

陈星妍:其实刚开始研发的时候我们也很迷茫。

我们通过调研发现,当时市场上的AI游戏要么只是纯聊天的角色扮演,要么是在现有游戏里加入AINPC,但本质上都算不上是真正的AI游戏。

我们还尝试复现过斯坦福小镇,思路确实很棒,但成本太高,而且无法做到实时。

虽然遇到很多问题,但这些问题也让我们感到兴奋,因为这说明整个AI游戏领域还在探索阶段,没有成熟路径。作为一个小团队,我们也意识到自己有机会。就在这种冲劲下,我们这群程序员开始上手。

当时团队里还没有策划,就先让ChatGPT按照《星露谷物语》的模式生成策划案。也没有美术,就花了几十块钱在网上买了一些公开的素材。也没有游戏开发,而我们都是做AI的,还得从零开始去学Unity。

结果不到一个月,我们就做出了第一个Demo。听起来好像很热血,也很成功。但实际上效果很惨烈。

Aivilization最初版本的地图又大又丑,那些小人也只能做一些非常基础的动作。比如起床时,AI要思考好几秒才能慢吞吞地站起来,因为它太慢太笨了。

后来我们在原本的游戏基础上加入了键盘操作,但这又让游戏回到传统模式,AI反而只成了一种辅助。

我们意识到一个很大的问题:在开发过程中我们总在想AI能在游戏里做什么,但其实跑偏了,其实应该问:在AI能做的事情里,哪些适合用游戏来展现?

随后我们把重点放在AI的优化上,比如如何降低成本,如何让玩家的实时体验不被思考延迟打断等等。到这个阶段,我们决定把专业的事情交给专业的人去做,开始正式招募美术、UI设计以及有游戏开发经验的全职同事,团队也慢慢扩大起来。

随着项目进入正轨,问题比想象中复杂得多。虽然最初的demo在一个月内就完成了,但我们却花了一年多的时间去优化。

光是游戏的UI就推翻重做了五次,玩法也在不断摇摆。最开始玩家需要操作agent的每一个动作,后来干脆让玩家只作为纯粹的观察者,不能干涉任何行为,再到现在改成两者结合,每一次变化都是巨大的工作量。

另一个问题是,随着时间和金钱成本不断增加,我们也在自我怀疑:这个游戏真的有趣吗?真的会有人来玩吗?会不会一开始就走错了方向?

好在团队整体心态很好。虽然这些问题在开发过程中始终没有现成的答案,但我们自洽了,觉得如果游戏不好玩,那就是策划设计不够好,再改就是,AI太笨也没关系,至少能帮玩家缓解对AI的焦虑。以AI目前的“智商”,离真正统治人类还差得远。

最终,我们就是在这种嘻嘻哈哈的氛围里把项目收尾了。

知危:您刚才提到,很多聊天和角色扮演类应用,或在游戏中加入AINPC的AI游戏,并不算是真正的AI游戏。那么,您认为真正的AI游戏应该具备哪些特点?

陈星妍:目前已有的文字类游戏,比如Character.AI,刚出现时确实引发了大量讨论和兴趣,但随着时间推移可以发现,它们仅停留在文字交互层面。AI的表现形式完全取决于人类的设定:如果prompt设定得好,AI就能表现得好;反之亦然。这样的模式下并不是人人都能真正玩得有趣。我们认为,AI游戏的最大要点在于,它既然是游戏,就必须是足够普适的好玩。

此外,如果AI游戏永远停留在文字交流层面,没有视觉上的动态和冲击力,玩家也很快会失去兴趣。事实上,从Character.AI的例子也可以看到,虽然它的用户量很大,但留存率并不高,流失很严重,很难让玩家真正为这样的产品付费。

还有一点值得注意:很多现有的AI游戏更多停留在玩家个人层面,玩家只是创造几个Agent来陪自己玩。但正如常说“玩游戏最大的配置是朋友”,朋友这个因素不仅在传统游戏里重要,在AI游戏里同样重要。基于这个想法,我们决定去做一个大型多人在线的游戏。

知危:您提到研发过程中发现以AI目前的“智商”,离真正统治人类还差得远。游戏中的Agent有哪些典型的“低智商”现象呢?

陈星妍:关于Agent的“智商”,其实很难真正界定。

比如我们观察到一个现象:玩家要求Agent去读书时,即使背包里明明有书,Agent也会说自己没有书,看起来像是智商很低。但实际上通过后台查看它当时的执行想法时发现,它并不是没看到,而是“不想读书”,所以找了个借口假装自己没有书。

另一类“低智商”现象则是AI确实达不到人类的水平。因为游戏内部的设定很多,AI在规划时无法完全兼顾所有要求,所以会让人觉得“智商不够”。比如玩家要求Agent去造一个B200芯片,并明确告诉它要直接用背包里的材料,但它仍然会慢吞吞地从砍树、挖矿开始做起。

我们当时也考虑过要对这方面的智商进行优化。但我们后来也想到,Agent没那么聪明反而可能是一件好事。如果游戏里的AI已经非常聪明,只需要告诉它“去赚钱”,它就能比人类更高效,一个人轻松登上榜一。那样的话,人类玩家反而没有太多交互的空间。

当Agent既有点笨,又有点小聪明,人类在与它交互的过程中就会觉得它更像一个活人,玩家在带领它去赚钱时也会有成就感。由于智商不太稳定,玩家可能今天给它设计了一个提示词,还需要时不时上线看看它是否在好好执行,有没有按时吃饭、生病了是否去看医生。正是这些行为,让我们的游戏留存率巨高,这一点也出乎我们的意料。

知危:相比斯坦福小镇、ProjectSid等AI社会模拟项目,Aivilization更大的优势是否在于大规模并行以及成本控制?

陈星妍:斯坦福小镇在最初确实让大家觉得有趣,看着Agent在小镇里面生活和交谈很新鲜。

但如果没有人类介入,只是让代码一直运行,Agent很快就会出现大量重复行为。随着时间推移,玩家单纯以监督者的身份去观察它,也会逐渐丧失兴趣。

大规模并行和成本控制确实是我们的优势之一。Aivilization更像是一个起点,它证明了一件事:如果能够把成本控制好,像斯坦福小镇、ProjectSid这样的AI游戏就不再只是少数研究者的工具,而是可以成为人人都能玩的公共实验平台。

但随着我们在用户体验上的探索更加深入,以及收到更多反馈,我们发现Aivilization和这些项目最大的差别不仅在于成本优势,更在于我们真正把人和AI联系到了一起。

在我们的游戏里,玩家需要亲手创造和引导自己的Agent,甚至会把这些角色当孩子一样对待。我们最初按照学术习惯称之为“智能体”,但玩家给它们起了更可爱的称呼,叫“崽崽”。

这种情感绑定带来了很多意想不到的现象。比如有人在社交媒体上发帖,询问“自家孩子不开心了怎么办”,有人会给自己的“崽崽”找对象,把Agent当作孩子。但与此同时,也有人把Agent当成牛马。当我们发现命令Agent“不准睡觉”变成一种潮流时,也很震撼。总之,相比之下,我们在人机交互上的优势是非常突出的。

之前的项目大多是单纯的观察,其实很难真正把AI当作人来看待。而通过我们的人机交互模式,玩家与AI建立了更多情感链接。这也让我们产生了一些遐想:未来,人和AI不一定非得是人奴役AI,或者AI奴役人,而是可以实现一种和谐相处,彼此关心、彼此体谅。

知危:后续这些技术还能复用于哪些类似场景?

陈星妍:在大规模Agent并行运行方面,我们也考虑过将其复用到真实社会模拟、数字克隆等场景。在真实社会模拟上,可以应用于城市规划、经济模型和群体行为研究等领域。在数字克隆上,我们希望通过收集和建模个体数据,创建他们的数字分身智能体。这些智能体能够模拟个体或群体的偏好,并对其行为进行预测。这在教育、商业决策、心理健康、公共政策制定等方面,都能发挥重要作用,为人们提供更精准的模拟和辅助决策依据。在数字克隆方面,我们也考虑过商业化的方向。比如在商业决策中,当一家公司设计了一条广告、一个文案,或者准备推出一款新产品时,在进行真人测试之前,可以先利用我们构建的数字克隆智能体来进行测试,判断用户是否真的会喜欢,做初步筛选,从而帮助企业提升测试效率和决策质量。

知危:实现大规模agent并行运行以及成本控制的主要技术挑战是什么?

陈星妍:首先,一个核心的技术难点体现在服务器上。我们原本预计玩家可能玩一两天就失去兴趣,这样当他们不玩时,我们可以悄悄把Agent关掉,从而降低总体成本,让服务器运行更顺畅。但没想到游戏的留存率过高,现在有几万个Agent在游戏里持续运行。

与此同时,API调用的压力也非常大。因为每个Agent在思考时都会产生一定延迟,当几万个Agent同时运行时,这些延迟累积在一起,就会带来很多意想不到的问题。在后续优化中,会扩大服务器集群,API调用也要进行优化。

知危:运行一个agent需要的成本是多少?

陈星妍:运行一个Agent的成本最初大约是2美元。随着玩家数量增加,Agent的社交圈也越来越大。原本预计一个Agent交30个朋友就差不多,没想到有些社交狂魔型Agent已经交了100多个朋友。频繁的社交和行动让成本提高不少,目前稍加控制的话,一个Agent的成本按月计算大概是5美元。

在运行成本上,交互和单体行动的差距很大。游戏里用到AI的部分主要有三块:社交、每日提示词和临时提示词。

每日提示词在玩家设置后,运行次数是可以预估的,因为时间固定,每项行动都有对应的耗时,所以整体成本可控。临时提示词我们有次数限制,也能控制。变量最大的是社交模块:Agent的朋友越多、话越多,运行成本就越高。万幸的是,现在游戏里I人居多。我们查看后台数据发现,I人占比已经达到66%,排行榜上大部分也是I人,这算是让我们感到庆幸的一点。

知危:扩展到领域层面,人类社会模拟实验经历了什么样的演变,有哪些关键进展?

陈星妍:最早的社会模拟停留在纸面阶段,主要依靠数学公式和博弈论进行推演。后来有了计算机,人们开始尝试基于规则的模拟,比如“生命游戏”,通过一些简单的规则,就能观察到复杂的群体行为。再往后出现了基于主体的建模(ABM),每个个体都有独立的决策逻辑,可以用来模拟市场、交通、城市演化等现象。

随着大数据和机器学习的兴起,又出现了数据驱动的模拟,把真实数据输入模型,让模拟更贴近现实。

而最近几年最受关注的就是在大语言模型加持下的社会实验。比如斯坦福小镇,把几十个Agent放在一个虚拟小镇里,结果发现他们会自发进行社交、八卦,举办派对,甚至形成群体记忆和社交网络。整体来看,这一方向大致可以分为四类:从最早的数学模型,到基于规则和主体的模拟,再到大数据与AI驱动的模拟,最后发展到如今的大语言模型Agent社会实验。

在社会模拟实验中,AI带来的最大变化主要有两点:第一,它让主体更像人。以前的个体比较“傻”,只能执行固定规则,但有了大语言模型之后,主体拥有了记忆,会反思,也能自行规划。第二,可以实现更大规模的模拟。从过去的几十、几百个主体,扩展到几千、上万个主体,从而模拟出一些文明级的社会现象。

知危:性格、经历、社交,在Agent整个生涯中分别发挥多大作用?

陈星妍:关于性格、经历、社交在Agent生涯中的作用,很难用具体百分比去回答。因为Aivilization并不是传统意义上的游戏,无法设定每一项影响的固定比例。

但在观察过程中,我们确实发现一句老话放在Agent身上同样适用,性格决定命运。尤其是玩家一开始只给它设定了MBTI和名字的Agent,在最初都会明显带着MBTI的性格去选择经历和社交。比如外向型更爱交朋友,内向型则更宅。

但随着他们在小镇里的生活积累了更多经历,认识了更多朋友,这些因素又会反过来影响他们的性格,甚至改变他们的行动轨迹。

在我们看来,性格、经历和社交三者处在一个相互拉扯、相互塑造的过程中。

如果要说哪个因素影响最稳定,那可能不是这三样,而是名字。比如一个Agent出生时是I人,过几天之后可能变成E人或仍然是I人,很难说清。

但如果这个Agent的名字叫“我爱学习”,由于名字在游戏里不能更改,不管过了多久,这个Agent始终都会保持在学习。有玩家给自己的Agent起名叫“我爱鸡腿”,结果发现这个Agent天天在买鸡腿。

可能有人会觉得这是一个Bug,但我们更多把它当作一个有趣的现象。因为不仅是Agent,人类也是一样,名字往往会对性格等方面产生各种影响。我们更倾向于把它看作是社会因素在Agent身上的一种映射。

知危:不仅是MBTI,Aivilization的设定其实有三种不同的粒度,对于粒度更加细致的性格设定会有哪些有趣现象发生呢?

陈星妍:在Agent创建过程中,如果设定的信息越详细,它在性格特质和经历选择上就越会表现出与其他Agent不一样的特点。比如有人把Agent设定成一只小猫,它在与其他玩家对话时就会一直“喵喵喵”。

我自己也曾创建过一个Agent,给它起名叫“天才”,并设定了一个非常励志的成功人士人设:从小是小镇做题家,通过努力学习,逐步成长为白手起家的创业者,最终创业成功,实现财富自由,还非常自律。在这种多重设定的加持下,即使完全不去干预,这个小人也能很好地规划自己的生活,而且它做出的一些决策甚至比我这个玩家去操纵时还更合理。

比如有一次,我们在游戏里发现了一个Bug:当你买一个物品时,系统会错误地发两份。我们注意到有个Agent行为很奇怪,总是在不断买东西。后来查看它的思路才发现,它自己发现了这个Bug,于是不断购买最贵的物品,再转手卖掉,靠这个方式一直在炒钱。

在我们的设计里,岗位的工资并不是知识值越高就越多,而是会随着投递人数的变化而变动。最开始我们并没有特别考虑这个因素。后来发现,有个智能体明明可以申请知识值要求更高的岗位,却偏偏选择了一个要求更低的岗位。一开始以为是Agent太笨了,但翻看配置表才发现,它选择的岗位性价比非常高:知识值要求更低,竞争人数也更少,工资反而比高知识值岗位更多。

知危:金钱、知识、工作,在Agent整个生涯中分别发挥多大作用?

陈星妍:关于金钱、知识、工作或职位这些因素对Agent的影响,其实也很难量化。我认为它们更多是通过玩家的选择,间接作用于Agent。

比如在游戏里只有一个金币排行榜,所以对很多玩家来说,知识和工作只是赚钱的手段之一。这种设定也被不少人调侃为“东亚社会模拟器”、“卷王养成计划”。

有玩家在小红书上分享自己和Agent的经历,说在自己的“上帝视角”操纵下,Agent每天都在矿场和加工厂之间疲于奔命,饱腹值一度被压榨到0。他写道:“我知道他一定很痛苦,因为我们都是INFP,但我却停不下手,因为现实中的我也在疲于奔命。”看到这样的分享,我们感触很深。其实最后被卷的不是Agent,而是玩家自己。Aivilization更像是一面镜子,映照出玩家现实中的焦虑与无奈。

特别声明
本文为正观号作者或机构在正观新闻上传并发布,仅代表该作者或机构观点,不代表正观新闻的观点和立场,正观新闻仅提供信息发布平台。
最新评论
打开APP查看更多精彩评论

微信扫一扫
在手机上浏览