一群追星星的人，对AI的盼与怕正观新闻

一群追星星的人，对AI的盼与怕

脑极体

2024-07-15 18:46

关注

面对AI，有人害怕，有人期盼。

“AI和画画的、开网约车的、写东西的人有仇吗？”近来成了很多从业者的心声。大模型技术驱动了AI的能力进化超过临界点，我们普通人根本就跟不上，或快或慢地被淘汰。看起来，AI正在给人类制造新的困境。

怕AI可以理解，那盼AI的人，到底在期盼什么呢？

前不久我在WAIC 2024上，发现了一个由孤独症儿童的父母、志愿者所组成的普通开发者团体，用AI给“来自星星的孩子”做绘本，这将“星宝”照护者们拉出了困境。

如何平衡AI的利弊，引导其健康发展，是我们这个时代亟须面对的重要课题。那些长期被我们忽略、存量问题待解的“小场景”，或许更需要先一步感受到AI。

“孤独症儿童的照护没有结果（可能无法治愈），能做的就是维持一定的生活质量，仅此而已。”

“每天要绞尽脑汁地给孩子编故事。一旦编不出来了，孩子就不睡觉了，大人孩子都很崩溃。”

“为了照护每天都不能出门、不能睡觉，我有时真的想死。”

孤独症儿童也被称为“来自星星的孩子（星宝）”，在社交、沟通、行为等方面有特殊需求，照护难度很大。精力不足，无法充足的睡眠，是“星宝”照护者们普遍的困境。

除了照顾“星宝”们的日常生活，照护者往往还希望提升孩子的生活质量，让他们也能感受到快乐和愉悦。“读绘本”就是一个能给星宝们带来幸福感的事情。

但定制绘本的缺失，让照护者们承受着情感上的痛苦。

孤独症AI绘本项目的发起人之一，就是“星宝”图图的爸爸。他提到：“我家图图特别爱听故事，特别是睡前故事，几乎每天晚上都要听故事入睡。但是由于孤独症孩子他们是有明显的兴趣狭隘和刻板这些特性的，他只喜欢听他感兴趣的几个话题，例如说安全常识，去郊外探险，孙悟空等，或者说这几个元素要融在一起才行，但市面上很难找到这样的绘本故事。”

既然市面上没有满足“星宝”个性化阅读需求的绘本，能不能自己做一个呢？

以公益产品“追星星的AI”为例，就通过大模型的三种能力，让这件事成为可能。

1.生成能力。“追星星的AI”通过家长或教师输入的一句话故事梗概（提示词），自动生成定制化的、图文并茂的绘本，包括常识认知、社交礼仪、心智解读、趣味故事等。

2.多模态能力。“追星星的AI”调用了通义大模型的文生图、语音合成等AI多模态能力，可以让一句话变成能被朗读的有声绘本，丰富阅读体验。

3.交互能力。大语言模型的核心技术特点之一，就是能够与人类进行更为自然、流畅的对话。“追星星的AI”APP中，上海美术电影制片厂授权的孙悟空、大耳朵图图等动画形象，可以作为主角给孩子们讲故事，增强交互感。

20世纪50年代初，AI概念初现曙光之际，人们对技术的愿景是，它能倾听并理解人类的需求，为那些最为亟需的人群伸出援手。

当AIGC之光照进星宝们的世界，让星宝家庭和照护者感受到来自科技的温暖与关怀，才是我们所期待的，技术在现实中的回响。

长期以来，将AI用于社会公益项目的尝试，屡见不鲜。为什么“追星星的AI”会引起我们的注意？

有一个特别的地方是：这个产品的开发，全部是由星宝照护者和志愿者来完成的。

非技术背景的普通人也可以掌握AI吗？跟“追星星的AI”工作人员聊了聊，或许可以给大家提供一些投身AI开发的思路。

首先，垂类应用要深入理解需求。

用AIGC生成绘本，这件事看起来非常简单易操作，几乎所有国产大模型平台都有全栈工具来支持从数据到精调、优化的所有步骤。但难点在于，每个应用所要求的细节都有很大差异。

比如星宝们可能没有办法理解过于复杂的图片信息。

“我们最开始生成出来的那一版图画，画面风格就有些复杂，出来好多星星点点的叶子、小花，被大家提出了意见，现在生成的就是这种比较干净的画面，一张图就是一个主体。”

“有的星宝对某些食物、动物会怕，是不能看见的，我们就设置了一个屏蔽功能，不会生成带有那些内容的图片。”

该项目的参与者既有星宝家庭成员，也有孤独症儿童干预机构，以及多年从事孤独症研究的高校学者。最终，结合星宝的认知水平层级，确定了最简洁的画面形式，突出人物，对话平实直接，确保AIGC生成方便星宝理解的画面。

其次，线上分布式协作方式。

一群家长和志愿者，到底要用多长时间才能做出一个AIGC应用？“追星星的AI”的开发时间是两个月。

坦率来说，这比很多“零门槛AI开发平台”、大模型社区所宣传的时间更长。目前，借助APP Inventor、APPMakr等简化开发工具，一个专业开发者创建一个功能丰富、交互复杂的应用，大概只需要两周甚至更短的时间。为什么“追星星的AI”落地时间要数月呢？

这是一个完全由大量在职志愿者完成的项目。其中有星宝的父母，有特教老师，大多数人以前都没有接触过AI。而且，他们分布在世界各地，平时还有全职工作，利用晚上或周末的时间来沟通和写代码，采用线上分布式协作的方式推动项目。

移动互联网时代有个著名的段子，有创业者说，“创意有了，钱也融到了，就差个程序员了”。AI开发，可能是有史以来第一次“去中心化”，普通人也可以通过线上分布式协作来参与技术世界当中。

此外，多机构的支持也必不可少。

一方面，绘本涉及动画形象，需要大量图片作为训练素材。其中上海美术电影制片厂授权并提供了悟空、图图等经典动画形象图库。另外，这些经典动画形象深入人心，要求模型的生成结果不能出现误差，尤其是“身体像面条一样”的悟空形象，一开始训练出来的效果并不理想。工作人员提到，后来上海美术电影制片厂的老师们并没有介意，后续又提供了更多的图库素材来帮助训练。

不难发现，“追星星的AI”是在很多非技术背景的人与机构的帮助下，才一点点搭建起来的。

近期以来，“担心被AI抢走工作”的焦虑已经出现了人传人现象。

尽管很多技术从业者、科普作家会反复强调，技术进步会让一些岗位消失，也会创造一些新的岗位，应该尽快主动地探索与规划未来职业。但客观来说，被AI淘汰的人，未必能快速适配新创造的岗位的技能要求。

难道人类社会就要毫不反思、毫不抵抗地加速迈入高度自动化、无人化阶段吗？我想起一句话：不要温和地走进那个良夜。

一方面，等待AI带来改变的场景很多，类似孤独症儿童照护这样的需求大量存在，以前并没有被很好地解决，智能技术的互动性、个性化等带来了前所未有的解题思路，这是技术应该最先到达的地方。

另一方面，每个人都能用好AI来解决实际问题，但他们需要得到实际的支持。除了科技企业搭建的平台和社区之外，支持有不同需求的国民继续学习、终身学习，已经成为很多国家的共识。

“哈佛幸福课”的讲师泰勒·本·沙哈尔说过：“一旦我们意识到自己的选项是什么，就很容易在短时间内作出决定。其中的关键点在于，意识到自己有选择，要比选择本身难得多。”

从这个角度说，“追星星的AI”让我看到了一群人关于AI的选择，或许也是你我更好的选择。

AI与人为敌，还是与人为友，选择权始终都掌握在人的手里。

特别声明

本文为正观号作者或机构在正观新闻上传并发布，仅代表该作者或机构观点，不代表正观新闻的观点和立场，正观新闻仅提供信息发布平台。

打开正观新闻客户端，阅读体验更佳