【我在一线,为您报道】“AI奶爸”让机器听懂话
开栏的话
2024年11月8日是中国第25个记者节。
这个节日,我们可以转换一下视角,把自己当作主角,去体验热气腾腾的生活、去感受各行各业的酸甜苦辣、去书写城市发展的故事。
这次,我们换一种角度去践行脚力、眼力、脑力、笔力;这次,我们不仅在一线、我们就是一线;这次,让我们距离现场更近一些、让我们扣时代的脉搏更紧一些、让我们的文风更接地气儿一些……
在记者节来临之际,本报推出【我在一线,为您报道】系列报道,走近不同行业代表身边,去体验各行各业的工作状态。我们深信,只有在一线,新闻才更生动;只有在一线,故事才更动人;只有在一线,记者才称得上是记者。
当你问AI:“秋季适合去哪里旅游?帮我做攻略。”
AI可能会回答:“主流推荐地:喀纳斯、九寨沟、稻城亚丁……小众推荐地:台州、郴州……”而且每个地点后面都有一篇旅游攻略。这样灵活多变的回答出现在人与生成式AI的对话中。在采访之前,我还会质疑人工智能的准确性、智能性,采访后我发现,其实,一款AI大模型产品之所以能够应对万千人的问题,是因为上市之前都会经过“AI奶爸”海量数据“投喂”,倘若在“训练”过程中出现错误信息,则会被“AI奶爸”迅速定位并及时修正。
本报记者(右)在工作人员陈世名指导下了解中国联通中原数据基地运行方式击使用方法。 本报记者 徐宗福 摄
今年,人社部发布了19个新职业,其中,“生成式人工智能系统应用员”应时而生。之所以被称为“AI奶爸”,因为其主要任务就是运用人工智能技术及工具,从事生成式人工智能系统设计、调用、训练、优化、维护管理等工作。用通俗的话说,就是帮助AI“懂事”,进而“做事”。
早上8:30,换上进入机房的蓝色工作服,生成式人工智能系统应用员陈世名带着我来到他每日工作的第一站——中原数据基地算力机房,来这里巡视机房算力集群服务器的运行情况,只见他穿梭在一排排大型“铁疙瘩”中,不停地查看、记录……
29岁的陈世名从河南大学硕士毕业后,进入中原数据基地工作,工作的主要职责除算力机房设备维护及云平台运营外,还有人工智能项目的研发管理,包括生成式人工智能系统应用。
“这些设备是我工作的重中之重,每天上班,我的第一件事就是进行线下和线上的巡检,确保它们的运行一切正常。”陈世名一边说,一边头也不抬地细致检查每一台机器显示的信号灯,接着他又说:“我们的机房有着很高的建设维护标准,通过先进的运维管理平台可以实现网络链路的自行诊断。”
看着眼前庞大的数据机房,我在惊叹之余不禁皱起眉头,人类的肉眼排查怎能与人工智能大模型飞速生成的效率同日而语?
也许是看出了我的疑惑,陈世名解释道:“其实模型都是靠数据来训练的。我每天都会写脚本进行排查、利用自主搭建的AI平台生成语料。”
训练大模型“学生”,需要大量的数据样本作为“课本”,为了研发部门的知识库模型,陈世名和他的团队搜集了大量的规章制度、运维规程、学习课程等文件,并将它们整理成大模型识别的文件格式,让大模型去学习。
我顿时恍然大悟。原来,大模型作为人工智能的代表性技术,在训练过程中,要把数据变成语料“投喂”给大模型,让它凭借语料“自学成才”。
来到办公室,坐在大模型的对话框前,我出于好奇,临时向陈世名提出了一个请求:“能否把我的采访问题发给它,看它怎么回答?”
“完全没问题。”
接下来,我把采访提纲中“生成式人工智能的应用领域有哪些?在赋能各行各业的过程中有什么案例?……”一连串的问题发给大模型,几秒钟的工夫,大模型“思考”后回复了让众人满意的文本。
这下,我彻底被眼前这个“智慧大脑”所折服。看到我接二连三地被震撼,陈世名笑了,他告诉我,目前,自己训练的大模型是部门内部“专属定制款”,是通过搜集大量的规章制度、运维规程、设备硬件说明书等文件,并将它们整理成大模型识别的文件格式,让大模型去学习训练而成的。
“您觉得未来人工智能的发展方向是怎样的?”采访最后,我问出了一直萦绕在我心中的问题。
“星星之火可以燎原。”陈世名一言以蔽之,“人工智能的发展前路漫漫、未来可期,今后将向多模态方向演进,与各行业作深度融合,涉及科研、开发、成果转化以及算力、算法、数据、产业应用、生态营造等相关领域。只有在各行业领域构建协作发展的多层次算力体系,才能更好赋能产业优化升级。”
而随着人工智能正在变得更加成熟和聪明,陈世名坦露,这促使他不停学习,以跟上技术的步伐,这需要继续创新,想出新点子来让人工智能更好地结合现有生产场景,帮助用生成式AI赋能百业千行。“我这‘老师’也得懂行啊,不然怎么教呢?”
学无止境,路漫漫其修远兮。在记者节来临之际,让我们继续在路上勇往直前吧。
郑报全媒体记者 陶然