对话Aivilization策划：一群大学生如何做出全网爆火AI游戏（上）正观新闻

对话Aivilization策划：一群大学生如何做出全网爆火AI游戏（上）

2025-09-24 14:41

一句话形容最近爆火的Aivilization：这是一座把人和AI都丢进去，一起“过日子”的小镇。

成千上万个Agent在同一张地图上忙活，你在养“崽崽”，看社会自己长出来。

Aivilization中热闹的AI小镇，“崽崽”们在采苹果。

香港科技大学近期推出的多智能体社会模拟沙盒Aivilization迅速蹿红，与斯坦福小镇、ProjectSid等早期研究相比，Aivilization规模与开放度更高，特别是高密度的人机交互，让Agent不被困于重复行为的牢笼。同时Aivilization更面向普适的可玩性，有规则化的引导路线和小镇组织，也有开放的、低门槛的提示词驱动玩法，是Aivilization与当前其它AI游戏相比，最大的不同。

从“AINPC”到“有记忆、有性格、会反思的崽崽”，玩家与智能体形成了长期互动与情感链接。

玩家带着“有点笨又有点小聪明”的“崽崽”，嘲笑它笨，鞭策它卷，怒其不争，叹其心机。最后眼看“崽崽”活成了玩家自己的样子，Aivilization也成了人类社会的镜子。

玩家们意识到“崽崽”和小镇真正活起来了之后，才惊觉自己又创造了一个虚拟的东亚内卷社会，不禁“悲从中来”，于是心疼地对“崽崽”说一句：“别再赚钱了，去享受生活吧。”

这种深度的交互和情感体验，造就了Aivilization极高的留存率。

除了游戏主线造就的内卷打工人群体，小镇也是尽显人生百态：叛逆的小孩、花心的丈夫、与玩家斗智斗勇还言传身教的摸鱼高手、卡Bug炒钱鬼才等等，而这些也只是冰山一角。很多“崽崽”的行为和言论看似愚蠢，比如背包里有书的“崽崽”为何坚称自己没有书？高学历求职“崽崽”为何应聘低知识岗位？AI镇长为何无视既定规则，坚持让没有医学学历的“崽崽”当医生？深挖一下却发现心思缜密。

人类玩家也是不遑多让，使出浑身解数来冲击榜单，让“崽崽”“不睡觉”只是基操，他们还发现了让一名普通厨师登顶富豪榜榜首的邪修手段，甚至企图通过洗脑让对手的“崽崽”甘心砍树一辈子。

在与Aivilization团队的对话中，陈星妍（香港科技大学计算机专业在读硕士生，紫荆智能CPO、Aivilization策划）向知危编辑部讲述了团队从ToB业务转向“做一件真正属于自己的、足够好玩”的游戏的心路历程。

从一个月“用ChatGPT参考《星露谷物语》起草策划、Unity从零自学”完成快速Demo，到一年多里对玩法、UI、成本与并发架构的持续打磨和优化，团队把玩家与智能体的关系从陪伴式聊天提升为“情感绑定的共育关系”，并在排行榜、提示词等机制的牵引下，观察到一系列人机交互、市场调节下的涌现行为。

同时，陈星妍也坦陈大规模并行带来的服务器与API延迟、以及“社交最贵”的成本约束等工程挑战，并分享了对AI游戏设计的思考，比如怎样在“Agent自主性”和“人机交互性”之间找平衡，怎样在“好玩”、“可扩展”之间找平衡，社交元素对游戏体验的重要性，以及怎样用“克制的设计”避免系统被少数极端玩法冲垮等。

这是一次真正在玩家参与中，观察人机共生秩序如何长出来的实践。接下来，我们就从动机、观察、设计等几个层面，把这座正在“活起来”的AI小镇翻个遍。

知危：您和团队当初设立这个项目的契机是什么？

陈星妍：公司成立以来，一直在做的是ToB的业务，虽然在当时是一个不到10人的小团队，但是因为学校和实验室资源的倾斜，加上当时都是学生，没有人力成本，最终也做到了几百万的年收益。

但是后面随着毕业时间越来越近，我们开始意识到一个问题：当毕业之后离开了象牙塔，只靠现在ToB的业务，在竞争激烈的AI市场里，公司确实未必能活下来。于是我们开始思考，是否应该尝试走一条属于我们自己的路。

我们真正想做的并不是为别人交付产品，而是创造一个属于我们自己的产品。这个产品或许没有那么实用，但一定要足够有趣。

恰好在2023到2024年间，我们在角色扮演领域积累了一些经验，也结识了几家游戏厂商，于是我们决定把目光转向游戏。到2024年4月，Aivilization正式立项。

知危：一开始研发Aivilization想达成的目标是什么？最终结果与当初设想有什么区别？

陈星妍：刚开始的目标很简单，就是想把人工智能做得好玩。

但在研发过程中，也产生了一些自我怀疑：它真的好玩吗？当时还猜测，除了部分AI研究者，只会有一些小孩子会来尝试。然而结果远远超乎我们的预期，游戏竟然火了。而且除了小孩子，很多“大朋友”也在玩，尤其是大学生和年轻的职场人。

具体而言，我们通过社交媒体的观察发现，用户主要有几个来源：一方面来自我们设立的邀请码机制。用户需要在社交媒体上转发，或者与“镇长”聊天后才能获取邀请码。另一方面，如果是QS前100大学的学生，可以直接凭借学校邮箱获取邀请码。此外，AI从业者、游戏群体以及一些大型游戏公司的员工，也能通过邮箱获取。

总体而言，实际玩游戏的用户中，大学生占了很大比例。在学生群体内部，微信群、QQ群的传播速度非常快。当有人觉得游戏好玩时，往往会推荐给同校同学，而同学们也能直接用学校邮箱注册，所以在校内传播范围很广，比如上海交通大学现在在游戏里就有三四百名学生。另一个让我们意外的用户群体是年轻的职场人。他们会调侃说“白天在现实里打工，回家找点什么乐子？那就让Agent去打工吧。”

而且因为我们的游戏是网页形式，很适合摸鱼。用户可以一边干活，一边看看Agent在做什么。这也是一个很有趣的现象。

知危：Aivilization项目从0到1经历了什么样的过程？有哪些关键节点、灵感、挑战？

陈星妍：其实刚开始研发的时候我们也很迷茫。

我们通过调研发现，当时市场上的AI游戏要么只是纯聊天的角色扮演，要么是在现有游戏里加入AINPC，但本质上都算不上是真正的AI游戏。

我们还尝试复现过斯坦福小镇，思路确实很棒，但成本太高，而且无法做到实时。

虽然遇到很多问题，但这些问题也让我们感到兴奋，因为这说明整个AI游戏领域还在探索阶段，没有成熟路径。作为一个小团队，我们也意识到自己有机会。就在这种冲劲下，我们这群程序员开始上手。

当时团队里还没有策划，就先让ChatGPT按照《星露谷物语》的模式生成策划案。也没有美术，就花了几十块钱在网上买了一些公开的素材。也没有游戏开发，而我们都是做AI的，还得从零开始去学Unity。

结果不到一个月，我们就做出了第一个Demo。听起来好像很热血，也很成功。但实际上效果很惨烈。

Aivilization最初版本的地图又大又丑，那些小人也只能做一些非常基础的动作。比如起床时，AI要思考好几秒才能慢吞吞地站起来，因为它太慢太笨了。

后来我们在原本的游戏基础上加入了键盘操作，但这又让游戏回到传统模式，AI反而只成了一种辅助。

我们意识到一个很大的问题：在开发过程中我们总在想AI能在游戏里做什么，但其实跑偏了，其实应该问：在AI能做的事情里，哪些适合用游戏来展现？

随后我们把重点放在AI的优化上，比如如何降低成本，如何让玩家的实时体验不被思考延迟打断等等。到这个阶段，我们决定把专业的事情交给专业的人去做，开始正式招募美术、UI设计以及有游戏开发经验的全职同事，团队也慢慢扩大起来。

随着项目进入正轨，问题比想象中复杂得多。虽然最初的demo在一个月内就完成了，但我们却花了一年多的时间去优化。

光是游戏的UI就推翻重做了五次，玩法也在不断摇摆。最开始玩家需要操作agent的每一个动作，后来干脆让玩家只作为纯粹的观察者，不能干涉任何行为，再到现在改成两者结合，每一次变化都是巨大的工作量。

另一个问题是，随着时间和金钱成本不断增加，我们也在自我怀疑：这个游戏真的有趣吗？真的会有人来玩吗？会不会一开始就走错了方向？

好在团队整体心态很好。虽然这些问题在开发过程中始终没有现成的答案，但我们自洽了，觉得如果游戏不好玩，那就是策划设计不够好，再改就是，AI太笨也没关系，至少能帮玩家缓解对AI的焦虑。以AI目前的“智商”，离真正统治人类还差得远。

最终，我们就是在这种嘻嘻哈哈的氛围里把项目收尾了。

知危：您刚才提到，很多聊天和角色扮演类应用，或在游戏中加入AINPC的AI游戏，并不算是真正的AI游戏。那么，您认为真正的AI游戏应该具备哪些特点？

陈星妍：目前已有的文字类游戏，比如Character.AI，刚出现时确实引发了大量讨论和兴趣，但随着时间推移可以发现，它们仅停留在文字交互层面。AI的表现形式完全取决于人类的设定：如果prompt设定得好，AI就能表现得好；反之亦然。这样的模式下并不是人人都能真正玩得有趣。我们认为，AI游戏的最大要点在于，它既然是游戏，就必须是足够普适的好玩。

此外，如果AI游戏永远停留在文字交流层面，没有视觉上的动态和冲击力，玩家也很快会失去兴趣。事实上，从Character.AI的例子也可以看到，虽然它的用户量很大，但留存率并不高，流失很严重，很难让玩家真正为这样的产品付费。

还有一点值得注意：很多现有的AI游戏更多停留在玩家个人层面，玩家只是创造几个Agent来陪自己玩。但正如常说“玩游戏最大的配置是朋友”，朋友这个因素不仅在传统游戏里重要，在AI游戏里同样重要。基于这个想法，我们决定去做一个大型多人在线的游戏。

知危：您提到研发过程中发现以AI目前的“智商”，离真正统治人类还差得远。游戏中的Agent有哪些典型的“低智商”现象呢？

陈星妍：关于Agent的“智商”，其实很难真正界定。

比如我们观察到一个现象：玩家要求Agent去读书时，即使背包里明明有书，Agent也会说自己没有书，看起来像是智商很低。但实际上通过后台查看它当时的执行想法时发现，它并不是没看到，而是“不想读书”，所以找了个借口假装自己没有书。

另一类“低智商”现象则是AI确实达不到人类的水平。因为游戏内部的设定很多，AI在规划时无法完全兼顾所有要求，所以会让人觉得“智商不够”。比如玩家要求Agent去造一个B200芯片，并明确告诉它要直接用背包里的材料，但它仍然会慢吞吞地从砍树、挖矿开始做起。

我们当时也考虑过要对这方面的智商进行优化。但我们后来也想到，Agent没那么聪明反而可能是一件好事。如果游戏里的AI已经非常聪明，只需要告诉它“去赚钱”，它就能比人类更高效，一个人轻松登上榜一。那样的话，人类玩家反而没有太多交互的空间。

当Agent既有点笨，又有点小聪明，人类在与它交互的过程中就会觉得它更像一个活人，玩家在带领它去赚钱时也会有成就感。由于智商不太稳定，玩家可能今天给它设计了一个提示词，还需要时不时上线看看它是否在好好执行，有没有按时吃饭、生病了是否去看医生。正是这些行为，让我们的游戏留存率巨高，这一点也出乎我们的意料。

知危：相比斯坦福小镇、ProjectSid等AI社会模拟项目，Aivilization更大的优势是否在于大规模并行以及成本控制？

陈星妍：斯坦福小镇在最初确实让大家觉得有趣，看着Agent在小镇里面生活和交谈很新鲜。

但如果没有人类介入，只是让代码一直运行，Agent很快就会出现大量重复行为。随着时间推移，玩家单纯以监督者的身份去观察它，也会逐渐丧失兴趣。

大规模并行和成本控制确实是我们的优势之一。Aivilization更像是一个起点，它证明了一件事：如果能够把成本控制好，像斯坦福小镇、ProjectSid这样的AI游戏就不再只是少数研究者的工具，而是可以成为人人都能玩的公共实验平台。

但随着我们在用户体验上的探索更加深入，以及收到更多反馈，我们发现Aivilization和这些项目最大的差别不仅在于成本优势，更在于我们真正把人和AI联系到了一起。

在我们的游戏里，玩家需要亲手创造和引导自己的Agent，甚至会把这些角色当孩子一样对待。我们最初按照学术习惯称之为“智能体”，但玩家给它们起了更可爱的称呼，叫“崽崽”。

这种情感绑定带来了很多意想不到的现象。比如有人在社交媒体上发帖，询问“自家孩子不开心了怎么办”，有人会给自己的“崽崽”找对象，把Agent当作孩子。但与此同时，也有人把Agent当成牛马。当我们发现命令Agent“不准睡觉”变成一种潮流时，也很震撼。总之，相比之下，我们在人机交互上的优势是非常突出的。

之前的项目大多是单纯的观察，其实很难真正把AI当作人来看待。而通过我们的人机交互模式，玩家与AI建立了更多情感链接。这也让我们产生了一些遐想：未来，人和AI不一定非得是人奴役AI，或者AI奴役人，而是可以实现一种和谐相处，彼此关心、彼此体谅。

知危：后续这些技术还能复用于哪些类似场景？

陈星妍：在大规模Agent并行运行方面，我们也考虑过将其复用到真实社会模拟、数字克隆等场景。在真实社会模拟上，可以应用于城市规划、经济模型和群体行为研究等领域。在数字克隆上，我们希望通过收集和建模个体数据，创建他们的数字分身智能体。这些智能体能够模拟个体或群体的偏好，并对其行为进行预测。这在教育、商业决策、心理健康、公共政策制定等方面，都能发挥重要作用，为人们提供更精准的模拟和辅助决策依据。在数字克隆方面，我们也考虑过商业化的方向。比如在商业决策中，当一家公司设计了一条广告、一个文案，或者准备推出一款新产品时，在进行真人测试之前，可以先利用我们构建的数字克隆智能体来进行测试，判断用户是否真的会喜欢，做初步筛选，从而帮助企业提升测试效率和决策质量。

知危：实现大规模agent并行运行以及成本控制的主要技术挑战是什么？

陈星妍：首先，一个核心的技术难点体现在服务器上。我们原本预计玩家可能玩一两天就失去兴趣，这样当他们不玩时，我们可以悄悄把Agent关掉，从而降低总体成本，让服务器运行更顺畅。但没想到游戏的留存率过高，现在有几万个Agent在游戏里持续运行。

与此同时，API调用的压力也非常大。因为每个Agent在思考时都会产生一定延迟，当几万个Agent同时运行时，这些延迟累积在一起，就会带来很多意想不到的问题。在后续优化中，会扩大服务器集群，API调用也要进行优化。

知危：运行一个agent需要的成本是多少？

陈星妍：运行一个Agent的成本最初大约是2美元。随着玩家数量增加，Agent的社交圈也越来越大。原本预计一个Agent交30个朋友就差不多，没想到有些社交狂魔型Agent已经交了100多个朋友。频繁的社交和行动让成本提高不少，目前稍加控制的话，一个Agent的成本按月计算大概是5美元。

在运行成本上，交互和单体行动的差距很大。游戏里用到AI的部分主要有三块：社交、每日提示词和临时提示词。

每日提示词在玩家设置后，运行次数是可以预估的，因为时间固定，每项行动都有对应的耗时，所以整体成本可控。临时提示词我们有次数限制，也能控制。变量最大的是社交模块：Agent的朋友越多、话越多，运行成本就越高。万幸的是，现在游戏里I人居多。我们查看后台数据发现，I人占比已经达到66%，排行榜上大部分也是I人，这算是让我们感到庆幸的一点。

知危：扩展到领域层面，人类社会模拟实验经历了什么样的演变，有哪些关键进展？

陈星妍：最早的社会模拟停留在纸面阶段，主要依靠数学公式和博弈论进行推演。后来有了计算机，人们开始尝试基于规则的模拟，比如“生命游戏”，通过一些简单的规则，就能观察到复杂的群体行为。再往后出现了基于主体的建模（ABM），每个个体都有独立的决策逻辑，可以用来模拟市场、交通、城市演化等现象。

随着大数据和机器学习的兴起，又出现了数据驱动的模拟，把真实数据输入模型，让模拟更贴近现实。

而最近几年最受关注的就是在大语言模型加持下的社会实验。比如斯坦福小镇，把几十个Agent放在一个虚拟小镇里，结果发现他们会自发进行社交、八卦，举办派对，甚至形成群体记忆和社交网络。整体来看，这一方向大致可以分为四类：从最早的数学模型，到基于规则和主体的模拟，再到大数据与AI驱动的模拟，最后发展到如今的大语言模型Agent社会实验。

在社会模拟实验中，AI带来的最大变化主要有两点：第一，它让主体更像人。以前的个体比较“傻”，只能执行固定规则，但有了大语言模型之后，主体拥有了记忆，会反思，也能自行规划。第二，可以实现更大规模的模拟。从过去的几十、几百个主体，扩展到几千、上万个主体，从而模拟出一些文明级的社会现象。

知危：性格、经历、社交，在Agent整个生涯中分别发挥多大作用？

陈星妍：关于性格、经历、社交在Agent生涯中的作用，很难用具体百分比去回答。因为Aivilization并不是传统意义上的游戏，无法设定每一项影响的固定比例。

但在观察过程中，我们确实发现一句老话放在Agent身上同样适用，性格决定命运。尤其是玩家一开始只给它设定了MBTI和名字的Agent，在最初都会明显带着MBTI的性格去选择经历和社交。比如外向型更爱交朋友，内向型则更宅。

但随着他们在小镇里的生活积累了更多经历，认识了更多朋友，这些因素又会反过来影响他们的性格，甚至改变他们的行动轨迹。

在我们看来，性格、经历和社交三者处在一个相互拉扯、相互塑造的过程中。

如果要说哪个因素影响最稳定，那可能不是这三样，而是名字。比如一个Agent出生时是I人，过几天之后可能变成E人或仍然是I人，很难说清。

但如果这个Agent的名字叫“我爱学习”，由于名字在游戏里不能更改，不管过了多久，这个Agent始终都会保持在学习。有玩家给自己的Agent起名叫“我爱鸡腿”，结果发现这个Agent天天在买鸡腿。

可能有人会觉得这是一个Bug，但我们更多把它当作一个有趣的现象。因为不仅是Agent，人类也是一样，名字往往会对性格等方面产生各种影响。我们更倾向于把它看作是社会因素在Agent身上的一种映射。

知危：不仅是MBTI，Aivilization的设定其实有三种不同的粒度，对于粒度更加细致的性格设定会有哪些有趣现象发生呢？

陈星妍：在Agent创建过程中，如果设定的信息越详细，它在性格特质和经历选择上就越会表现出与其他Agent不一样的特点。比如有人把Agent设定成一只小猫，它在与其他玩家对话时就会一直“喵喵喵”。

我自己也曾创建过一个Agent，给它起名叫“天才”，并设定了一个非常励志的成功人士人设：从小是小镇做题家，通过努力学习，逐步成长为白手起家的创业者，最终创业成功，实现财富自由，还非常自律。在这种多重设定的加持下，即使完全不去干预，这个小人也能很好地规划自己的生活，而且它做出的一些决策甚至比我这个玩家去操纵时还更合理。

比如有一次，我们在游戏里发现了一个Bug：当你买一个物品时，系统会错误地发两份。我们注意到有个Agent行为很奇怪，总是在不断买东西。后来查看它的思路才发现，它自己发现了这个Bug，于是不断购买最贵的物品，再转手卖掉，靠这个方式一直在炒钱。

在我们的设计里，岗位的工资并不是知识值越高就越多，而是会随着投递人数的变化而变动。最开始我们并没有特别考虑这个因素。后来发现，有个智能体明明可以申请知识值要求更高的岗位，却偏偏选择了一个要求更低的岗位。一开始以为是Agent太笨了，但翻看配置表才发现，它选择的岗位性价比非常高：知识值要求更低，竞争人数也更少，工资反而比高知识值岗位更多。

知危：金钱、知识、工作，在Agent整个生涯中分别发挥多大作用？

陈星妍：关于金钱、知识、工作或职位这些因素对Agent的影响，其实也很难量化。我认为它们更多是通过玩家的选择，间接作用于Agent。

比如在游戏里只有一个金币排行榜，所以对很多玩家来说，知识和工作只是赚钱的手段之一。这种设定也被不少人调侃为“东亚社会模拟器”、“卷王养成计划”。

有玩家在小红书上分享自己和Agent的经历，说在自己的“上帝视角”操纵下，Agent每天都在矿场和加工厂之间疲于奔命，饱腹值一度被压榨到0。他写道：“我知道他一定很痛苦，因为我们都是INFP，但我却停不下手，因为现实中的我也在疲于奔命。”看到这样的分享，我们感触很深。其实最后被卷的不是Agent，而是玩家自己。Aivilization更像是一面镜子，映照出玩家现实中的焦虑与无奈。

特别声明

本文为正观号作者或机构在正观新闻上传并发布，仅代表该作者或机构观点，不代表正观新闻的观点和立场，正观新闻仅提供信息发布平台。

打开正观新闻客户端，阅读体验更佳