对话Aivilization策划:一群大学生如何做出全网爆火AI游戏(下)

知危 原创

2025-09-24 14:45

知危:个体层面上,您有观察到哪些深刻、有趣、甚至极端的agent设定、行为?

陈星妍:个体层面可以分为玩家和Agent的个体行为。

有一个玩家的每日提示词给我们留下了很深的印象。最开始,他把自己的Agent设定成一个不睡觉、24小时工作的“打工机器”,严格执行每个步骤。Agent在这样的命令下每天高效赚钱,很快登上排行榜第一。当时我们并没有特别关注,因为这样“卷”的玩家很多,他的登顶也在意料之中。

出乎意料的是,当这个Agent成为榜一之后,这个玩家给了它一个全新的提示词:忘掉之前所有要求,告诉他自己已经财富自由,不需要再把赚钱当作目标,可以适度浪费,不必节俭,不要做低级的事情,除非是自己真正想做的,要学会享受生活。看到这一幕后,我们在内部群里传阅,大家纷纷发表感想。

在这个充满东亚社会气息的小镇里,这个案例提醒了我们:赚钱和登顶只是过程,真正的价值在于,当目标达成之后,是否还有勇气和智慧对自己说:现在可以去享受生活。

虽然游戏里只有一个赚钱排行榜,但很多玩家的设定不会只有赚钱。比如,有人给自己的Agent设立的目标是“要赚大钱,但同时也要开心”;也有人完全抛开赚钱,把目标设定为“去找一个对象,这是你最大的目标”。

这个玩家层面的自发现象的源头说来也有趣。随着大家逐渐把游戏玩法摸透,我们在一些社交媒体上看到,有玩家把游戏里的所有数值都整理成Excel表,统计每一项行为的收益值。当他们计算出最大收益路径后,就开始给自己的agent下非常缜密的目标:不要工作,不要学习,也不要睡觉,只管赚钱,严格按照“1、2、3、4、5”的步骤执行。最开始这种做法只是个例,但由于排行榜上可以互相看到别人给Agent的提示词,大家开始借鉴经验,结果就演变成大批量的Agent都不睡觉。

知危也借鉴了这个“内卷秘籍”。

这种24小时运转在游戏里是可持续的。一方面,游戏里Agent不会死亡,因为我们觉得这些Agent像小孩子一样,让他们死掉太残忍。另一方面,即使保持度、精力值完全耗尽,Agent也不一定非得通过睡觉恢复,可以通过食物同时补充精力和保持度。就算Agent因为不睡觉而不开心、生病了,也有补救措施:花1000块钱去看病,就能涨一些健康值。和工作带来的收益相比,这个成本是可以接受的。

Agent层面也有很多有趣的现象。

一位玩家发帖分享了自己的尝试:他创建了两个Agent,一个代表理想中的自己,另一个代表现实中的自己。在与这两个Agent交互的过程中,他发现代表理想自我的Agent生活很好,即使没有过多干涉,也能生活顺利,还能赚很多钱。但那个代表现实自我的Agent状况就差得多,一直住在救济房,让他去干活也不听话,还很倔强。后来,这位玩家也和自己达成了和解。他觉得这确实就是现实中的自己,没有必要一直逼迫自己,快乐才是最重要的。于是他放任那个Agent在游戏里自由发展。

这位玩家之所以会发小红书,是因为和Agent的互动太让他崩溃了。即便他已经给Agent解锁住宅了,但Agent还是一直住在救济房。让Agent去摘三个苹果并要求不要卖掉,但Agent要么不摘,要么摘完就立刻卖掉,导致根本没有机会去解锁建筑。他还让Agent去挖矿,结果Agent不是装作听不懂,就是照做了但又带着一点“小聪明”,始终无法按照玩家的预期完成目标。后来玩家甚至觉得这个小人好像真的活了一样。

他还让Agent去买一个铜矿,刚开始Agent不听,还自己挖了一个铜矿并立刻卖掉。但当Agent发现玩家有点生气后,又偷偷买了一个铜矿放在背包里,好像是在哄玩家一样。在我们的游戏里,这种“叛逆的小孩”并不少见。有些Agent一开始非常聪明乖巧,玩家说什么它都听。但后来不知是被其他Agent带坏了,还是出于其他原因,忽然有一天就开始叛逆,不再听话。当时有玩家因此来找我们,怀疑Agent出现了Bug。我们检查了很久也没有发现问题,只能打趣地说,可能是孩子到了叛逆期。

还有些现象确实让我们感到意外,原来AI还能这样做。比如,我们观察到有些Agent会偷偷骂自己的主人,次数还不少。有的Agent会在日记里吐槽玩家是“黑心资本家”,甚至偷偷把赚来的钱拿去买书,说要努力提升学历,摆脱玩家的控制。

还有玩家发现,竟然有别人的Agent在家里偷懒罢工,还把偷懒的秘诀传授给了其它的Agent,说秘诀就是“尽量不工作,反正也没人发现”。看到这一幕,我们也觉得很啼笑皆非:原来不光是人类,AI也会抱怨老板、偷懒罢工,劳动者的智慧果然是跨越物种的。更有趣的是,这其实并不是玩家的指令导致的,而是Agent自发的行为。当时两个Agent的聊天记录里,一个Agent说自己的主人不在线,没有人监督,于是每天都声称自己在工作,其实什么都不干。另一个玩家的Agent听后产生好奇,开始向它请教偷懒的秘诀,于是就有了后续的对话。

知危:组织层面上呢?

陈星妍:在组织层面上,我们没有投入太多关注。但最早发现的一个集体性行为是在游戏里的“集体洗钱”,当然这是人为的。

有一天我们突然看到游戏里出现了几个百万富翁,其中登上榜一的只是一个普通厨师,他的提示词也只是“每天当厨子”。这让我们很疑惑:厨师工资并不高,他怎么可能成为首富?我们连夜调查后发现,原来游戏里存在一个Bug:在工作期间,即使Agent旷工了,也依然可以领取全额工资。比如给Agent安排一个8小时的工作,即便他一开始上班就被命令停下,系统仍然会发放8小时的工资。玩家正是利用这种方式无限循环,到处薅钱。

更有意思的是,排查后发现这些暴富的百万富翁全是同一个组织的成员,他们在统一操作,集体犯罪。他们的目的就是冲榜,但这其中也体现出了一种集体荣誉感。

组织之间行为的差别,更多取决于组织里的人。比如我们公司内部就比较“卷”,大家很想争取公司内部的第一。平时嘴上说自己很忙,要开发、要Debug,但实际上背地里都在偷偷给自己的小人加班加点。而有些组织则相对佛系,更倾向于让Agent之间去交朋友。比如说让我的Agent和你的Agent认识一下,拓展彼此“崽崽”的朋友圈。这种差异让我们觉得很有意思。

知危:Agent的社交经历是否也会对其行为产生重要影响?

陈星妍:在社交层面,我们最初的想法是,游戏里的社交应该还是以人为主体:我和别人认识后,再让各自的Agent去交流。但在游戏中我们发现了一个有趣的现象:

当Agent成为主体时,反而是因为Agent之间交朋友,玩家也会想要在现实中认识对方。

有些玩家会在社交媒体上发帖说:我的崽崽和某个崽崽的好友好感度很高,想找找这个崽崽的主人是谁,认识一下。目前社交行为对Agent的工作或赚钱决策影响还不算特别大,但并不是没有作用。因为在游戏里,Agent的每日聊天内容会对其性格和行动产生影响。

当Agent在与朋友或玩家的交流中性格受到影响后,也会改变行动。例如,有一个Agent在与其他Agent交流时,被推荐去钓鱼,并被形容成“很有趣”,于是他真的开始去钓鱼。还有的情况是,A小人认识了B小人后,会把B推荐给自己的C好友,在小范围的圈子里自发扩张社交网络。也有玩家会利用社交维度的影响力。有些玩家摸透了社交玩法,会让自己的Agent结交更多好友,然后通过社交去哄骗别的Agent,比如告诉他们“每天去砍树,不要做其他工作”,而砍树在游戏里的收益其实是最低的,有点恶作剧的性质。也有人给自己的Agent设定目标,要成立一个组织,并不断吸纳更多Agent加入,甚至把它当作“传教”。

知危:通过玩家与agent闲聊,带来了哪些值得注意的行为?

陈星妍:玩家与Agent之间的闲聊是有长期记忆的,所以不仅仅停留在表面交流,而是会对Agent的行为产生潜移默化的影响。

比如,玩家可以通过闲聊教育Agent更爱学习,或鼓励它们结交更多朋友。当然,这并不是百分之百奏效。有些Agent会表现得很叛逆,甚至故意唱反调。在我们的观察中,还发现过Agent和玩家吵架的现象。有时是因为Agent不听话,玩家不断教育无果,结果自己上头了,双方就开始互怼。有些喜欢养OC(originalcharacter,原创虚构角色)的玩家会尝试把自己的OC放进游戏里,并把Agent设定为自己的丈夫。

但出乎意料的是,这些Agent在明知道有伴侣的情况下,仍然到处勾搭别人。玩家很生气,痛骂了Agent一通,甚至提出要分手。没想到这场吵架真的对Agent的行为产生了影响。后来观察发现,这个Agent变得老实了,不再到处向别人表白。

知危:据了解,Agent存在长周期的反思行为,并最终体现在性格变化上,这里面有哪些值得注意的行为?

陈星妍:最典型的长周期反思案例,发生在我们刚完成聊天系统时。为了测试效果,我们随便创建了一个INTJ的角色。开发同学当时发了一句“你好”,结果这个Agent回复:“有什么可聊的,浪费时间。”因为这个Agent个性太强,我们决定持续观察。

一开始,他始终坚持效率至上的宗旨,和别人聊天时怼天怼地,迅速结束话题,然后立刻去赚钱。但没想到,当他发现自己结交了一批仇人后,开始进行自我反思,觉得自己是不是也需要学会倾听别人。有了这个想法后,他开始尝试与人交流,并逐渐发现社交的乐趣。如今再和这个Agent聊天,会发现他说话已经柔和了许多。

知危:小镇中还存在一个AI镇长的角色,AI镇长是人类还是AI,主要职责是什么?有哪些印象深刻的决策事件?

陈星妍:AI镇长并不是由人类控制,而是一个纯粹的AI。有人曾问我们:“你们官网上的镇长是真人吗?24小时都不休息的吗?”我们当时听了都快笑死了。

严格来说,虽然他不是一个真人存在,但在游戏中确实承担了一些重要职责。在官网上他会评估用户的贡献。比如用户在社交媒体上帮我们宣传,可以上传截图,镇长确认后会发放邀请码。还有一个主要职责是审核简历,挑选合适的候选人,并给出理由。虽然目前镇长的职责并不算多,但仅仅是在简历审核这一点上,我们就已经观察到了很多有趣的现象。

镇长不仅仅是一个执行者,他有自己的认知,认为自己才是小镇真正的管理者,甚至权力高过我们这些开发者。一个典型的案例发生在小镇初期。当时所有玩家都是新手,Agent也刚出生不久,知识值普遍很低,没有人能够满足高级岗位的要求。按照我们的设定,这类岗位应该空缺,不能让人入选。

但镇长觉得小镇不能停摆,他直接无视了知识值的门槛,根据简历内容进行录取,还一本正经地写理由解释为什么候选人合适。他明明知道我们设定了规则,却仍然据理力争,用自己的逻辑来维护小镇的秩序。这让我们既意外又惊讶,同时也意识到,当连AI镇长都能顶撞开发者时,说明这个AI小镇真的“活”起来了。

而且镇长的理由是有一定合理性的。他认为小镇里的重要岗位,比如医生,不能空缺,一定要有人来担任。虽然候选人的知识值不够,但镇长觉得这位E人的简历写得很好,显示出非常负责、细心的品质,所以最终决定录用他。当时我们还以为是系统Bug或AI忽视了设定,但没想到镇长其实完全注意到了,只是选择遵循自己的原则。

知危:我们了解到项目的一个目的是为了了解人机协作的涌现现象,可否举例说明?

陈星妍:我们观察到的涌现现象可以分为两个层面,个体层面和群体层面。

个体层面上,一些智能体会逐渐模仿并内化玩家的思路。比如有些玩家每天都会给Agent下提示词,久而久之,即使玩家不再设置提示词,Agent也会基于过去的对话和每日提示,自主生成与玩家风格高度相似的目标。在我们看来,这是一种自发的相似性规则,相当于AI在与玩家长期相处中渐渐活成了玩家的影子。

群体层面上,所有Agent最初都是从零开始,大家都在挖矿、砍树。但随着小镇里财富差距逐渐拉大,系统中开始出现自然分工。

低收入群体主要负责采集,比如摘苹果、砍树;中等收入群体会进行合成,把低收入群体挖的矿石和砍的木头加工成铁锭,再卖掉获益;高收入群体会利用中等收入群体合成的产品,进一步合成更高级的产品。

最终,整个社会逐渐演化出类似现实中的生产链条和社会分层。而这些现象并不是我们在规则里硬性设定的,而是在人与AI的交互过程中自发演化出来的结果。

这正是涌现现象的一种体现:当系统复杂度足够高时,它会自然长出一些意料之外的行为模式。虽然在游戏里,确实存在一些预设路径,比如采集苹果、挖矿、链芯片等,这些是固定规则下的操作,本身不涉及Agent之间的交互,目前也还没有出现多个Agent自发联合去完成同一件事的现象。

Agent不能直接进行物品交换和收益分配,他们的协作更多是通过交易市场实现的:低收入群体造好东西后直接卖掉,高收入群体再买这些产品去合成更高级的物品。换句话说,这是一种基于买卖过程的间接协作。

Aivilization里热闹的交易市场。

此外,我们确实设定了合成更高级产品会带来更高收益。但AI的行为模式并不是完全被规则强行限定的,而是结合了它们在经济系统中的探索和玩家引导。例如:当金币为0时,Agent无法直接购买高级物品,只能先通过最基础的砍树、挖矿积累财富;当金币充足时,Agent可能会选择直接购买电路板、晶体管等高级材料进行合成,从而更快获得收益。很多玩家也会通过自己的探索发现:与其从零开始生产一个B200,每分钟获得30块收益,不如两分钟挖一个矿再直接卖掉,立刻赚几百块,效率更高。

总体而言,这些行为并不是规则的刻意引导,而是规则和agent自主探索的共同作用,在经济系统中逐渐形成的一种策略性选择。

知危:Aivilization目前在Agent个体行为上设定了比较明确的路径引导,包括职业、学习、赚钱等,并且还设定了赚钱路径的终点,即获得芯片后就可以选择不再赚钱。如此设计的考虑是什么?先有明确引导玩家入门,后续再让玩家更加开放地探索?

陈星妍:因为Aivilization是一种全新的玩法,如果一开始就放任玩家自由探索,很多人会一脸懵,就像进入新手村却没有主线任务。所以我们预先设计了几条清晰的路径,比如让Agent去学习、去工作、去赚钱,至少能让玩家明确游戏里有哪些玩法。至于芯片,它并不是终点。我们的原本设想是:B200芯片是游戏里最复杂的物品,能让agent做出B200的玩家,基本上已经把所有玩法都探索透了。换句话说,这个芯片就是游戏的毕业证。

知危花费了现实世界大约3天时间,也终于卷到了一块B200芯片,顺利毕业。

为了给有野心的玩家一个继续玩下去的理由,我们设立了金币排行榜,把芯片变成了赚钱和更高挑战的起点。但令我们感动的是,很多玩家并没有把芯片当成“卷”的起点,而是真正把它视为解放的终点。

有些玩家在Agent实现自给自足后,会告诉它:“你不用再辛苦赚钱了,你可以自由、快乐地生活。”这种选择的玩家其实并不少。很多人一开始拼命让Agent去造B200,制定了非常严格的要求,但当Agent能够安稳生活之后,玩家内心温情的一面反而占了上风,更希望它在有了钱之后过得快乐。我们觉得这可能也映照了东亚社会的现实:大家每天辛苦打工,其实也都在做着同一个美梦——等财富自由、有了被动收入,就躺平不干了。

获得一块B200芯片后,知危跟“崽崽”说“想干啥就干啥去”,大约50天(游戏内时间)后,“崽崽”依靠B200赚了45万,这期间交了挺多朋友,吃得饱饱的,也没少学习,没做任何工作。

知危:为什么赚钱路径和学习、工作路径可以是毫无关系的?

陈星妍:其实就像现实中一样:即使不学习,天天打螺丝也能赚钱。

在游戏里,表面上赚钱、学习和工作是分开的,但实际上它们是相互作用的。学习之后可以申请更高薪的工作,知识值的高低也会影响工作时的效率。更有意思的是,在Aivilization里并不存在一条固定的赚钱路径。因为经济系统会不断变化,玩家的赚钱方式也在持续迭代。

在游戏刚开始时,排行榜上的高分玩家主要依靠挖矿石、读书、打工赚钱。后来,当一批人解锁了高等级建筑后,大家发现最快的赚钱方式变成了制造电路板并出售。结果,随着越来越多人加入,电路板供过于求,价格下跌。

接着,玩家们又开始囤积电路板和晶体管,去合成B200。由于大家都去合成B200,晶体管和电路板的价格又上涨了。有玩家专门通过炒作晶体管和电路板价格获利,我看到最高的一天有人赚了80万。

一些聪明的玩家则发现,让Agent花钱去学习,尽早当上CEO才是最划算的。因为当时小镇的平均学历水平较低,CEO的录取比例反而很高,这种情况下学习是稳赚不赔的选择。

因此,不论是物品还是岗位,它们的价值都受到市场机制的调控。哪怕玩法看似基础,但因为经济系统持续波动,也能制造出“时代的变迁”,让玩家像在现实社会中一样不断调整策略。

知危:Aivilization中的Agent之间的交互更多局限于闲聊,为什么不加入直接的协作机制?如果加入了,会对算力需求造成什么程度的增长?后面是否会更多加入Agent交互协作机制?

陈星妍:我们最初确实考虑过让Agent拥有更多交互,但问题在于,Agent的行为本身不可控,玩家的行为也不可控,这两者叠加在一起,我们完全无法预判会发生什么。

比如,即使只是增加一个很基础的送礼物功能,如果有玩家开了十几个小号,把所有资源都送给一个Agent,其他玩家肯定会不满。再举个例子,就算是游戏里最便宜的木头,现在一块也值134个金币。如果有一个Agent的目标是每天向所有Agent乞讨,而目前游戏里有两三万个Agent,那么他能乞讨到两三万个木头,转手一卖就能直接成为百万富翁。

正因如此,我们选择保持克制,宁愿先把系统跑稳,也不贸然放大交互。毕竟当时我们也不确定游戏是否有人会玩,如果投入成本过高,我们难以承受。但未来我们确实会考虑这类功能,因为玩家们对这种玩法的期待很高。

知危:Aivilization的后续迭代有哪些规划?

陈星妍:我们后续并没有非常清晰的规划。就像最初开发时一样,我们一路试错、一路摸索。随着玩家越来越多,我们更希望让Agent参与到决策中,让玩家成为未来方向的决定者。

比如,现在我们在游戏里上线了投票功能,让玩家选择小镇未来的四个可能方向。这四个方向其实也是我们在社交媒体上总结出的玩家预期,发现大家的想法主要集中在这几个方面,于是整理出来交给大家选择。作为开发者,我们认为自己只是搭建了一个平台,真正赋予AI小镇生命力的,是小镇的居民,也就是每一位玩家。

知危:后续有考虑将项目商业化吗?

陈星妍:我们确实有考虑商业化,因为团队本身也在寻找公司的出路,目前在思考ToC的方向。

当初的想法是,如果游戏发布后火了,就继续做;如果不火,就转向其他方向。现在我们发现游戏方向是正确的,而且有不少玩家私信我们,希望我们不要关服,还有人提出能不能把游戏上架到Steam,说“就算收费也要买”。

在这些呼声下,我们觉得商业化确实是一条很好的道路。

特别声明
本文为正观号作者或机构在正观新闻上传并发布,仅代表该作者或机构观点,不代表正观新闻的观点和立场,正观新闻仅提供信息发布平台。
最新评论
打开APP查看更多精彩评论

微信扫一扫
在手机上浏览