打破“幻境”回归应用 全国首个零售金融大模型在产业界逆袭
在大模型的“神秘”光环逐渐散去之后,“百模大战”的参赛选手们来到中场。
拥挤的赛道上有一个共同的疑问——“新的赛点在哪里?”
共识在各行各业似乎已经达成,那就是落地到垂直的实际应用之中。
在高度依赖数据和技术的金融行业,有着深厚科技积淀和研发实力的马上消费,再次展现“马上速度”,于8月28日,在业内率先推出零售金融大模型“天镜”。
大模型步至中场,该如何破局
以ChatGPT为代表的通用大模型,掀起了风起云涌的人工智能(AI)浪潮。没有人不相信,这带来的将是NLP领域乃至整个人工智能的技术革命,影响遍及各行各业。
这也带火了对大模型产品的研发,众多企业跑步入场。从全球已发布的大模型分布来看,中国和美国大幅领先。其中在国内,据权威统计,今年上半年,已发布的各类大模型数量超过100个,大约80个参数在10亿规模以上的大模型,用“百模大战”来形容毫不为过。
但是,揭开“神秘”的面纱,在过去几个月中,这些涌现出来的大模型产品,通常都偏向于面对C端的聊天对话。但是C端用户的付费意愿偏低,到目前为止,只有ChatGPT这种产品形态在To C市场得到了验证。
而且值得注意的是,在今年6月,ChatGPT的月度流量首次出现下降——在全球的桌面和移动端流量比5月减少9.7%,独立访客减少5.7%。
另外,不少国内大模型产品设计一味追随ChatGPT,也导致了严重的同质化现象。
市场上有声音认为,“不具备发展方向的参数提升是没有意义的”。创业公司追一科技也表示,“垂直大模型是坚实的机会,就像发现美洲大陆这件事远不只成就了一人而已”。
的确,回归理性,对于公司而言,来到大模型竞争的中场,如果想在大浪淘沙中赢得生机,必须打破此前看似赢得先机的“幻境”,并将大模型落地到实际的应用场景之中。
宣称“不作诗,只做事”的华为已经做出示范,先后布局了矿山、药物分子、气象、海浪等行业大模型;京东灵犀也把触角深入零售、物流、健康等场景,解决真实产业问题。
金融业作为行业生态链金字塔最顶端,正如中国工程院院士倪光南所言,这一行业人工智能应用要求高、场景丰富,是大模型技术和算法突破的沃土。
马上消费首席信息官蒋宁也表示,金融行业天然有着数据密集型、技术密集型的属性,一直在探索数据资产化,挖掘数据价值,同时又面临着如银行线下网点的价值传递效率问题、用户体验问题,需要机构持续创新。
马上消费首席信息官 蒋宁
那么,大模型在金融行业该如何落地呢?
近2000个模型支撑,“想犯错都难”
蒋宁首先在认知上,给大家对传统的通用大模型和金融大模型作了区分。
他介绍,传统大模型目前还面临关键性任务和动态适应性、个性化要求和隐私保护、群体智能与安全可信和基础设施的能力四大难题。
他举例表示,生成式模型就像一个博士生,满腹经纶,且在答错问题时,可以不承担风险。但这不适用于自动驾驶,因为自动驾驶在刹车、提速、转弯、看灯时,外界环境都在变化,对向车也在变化,即使是1%的错误,都会造成生命财产损失。
这就是金融大模型和传统大模型最大的区别,即生成式模型它不能做解释,但金融大模型最主要的特点是具备判别性,它需要做出交易决策。
正是基于这种判断,以及在金融领域多年的科技和数据积累,马上消费一马当先,发布了其零售金融大模型——“天镜”。
“我们有将近2000个模型,20万张表,每天都在变化,但环境不管如何发生变化,让模型犯一次错都是非常不容易的。”蒋宁说。
这背后是马上消费作为以科技驱动的头部持牌消费金融机构,积累了1.79亿的用户,10万+变量,近50PB的多模态和高质量的数据等,通过在这些自身数据上做模型精调对齐训练,同时再用推理加速技术实现模型可控,从而让马上消费做到更懂金融。
蒋宁表示,马上消费已形成“三纵三横”的大模型发展技术布局,并领航构建可信、合规、多模态、适配全域、泛化的金融大模型技术能力体系,聚焦行业领先的基础语言特性能力、逻辑和推理能力、语义理解、生成与创作、金融领域能力、安全与合规能力等六大核心领域,进一步推动金融数字化转型产生实质性的飞跃。
所谓三纵,是指实时人机协作、多模态智能、数据决策智能,在数据领域实现智能化,实现结构性数据判别式模型的综合能力。三横则是指持续学习、模型合规、组合式AI形成安全、合规、可信的技术能力,确保模型越用越聪明,同时更稳定、更安全可控。
“我们希望在任何情况下,它给客户的回答都是合规的,并且在任何不可预期的情况下它的结果是稳定的。”蒋宁这样说。据介绍,在算力平台方面,马上消费现拥有近万台服务器和近千张GPU储存卡。
从“普”到“惠”,助力金融高质量发展
基于三纵三横,马上消费人工智能研究院院长陆全围绕引爆企业的数据潜能,打造全能数字员工这一核心,对天镜大模型在汇集智慧、唤醒知识、众创价值、数字分身四大应用场景进行了解说。
汇集智慧方面,主要是应用在人工客服场景,通过大模型提炼萃取一线优秀人工坐席客服经验,汇聚成群体智慧,从而拥有一对多服务客户的能力。该模型已运行近3个月,意图理解准确率达91%,相较于传统AI的68%有较大提升;客户参与率61%,高于传统模型43%的参与率,也高于人工坐席平均28%的水平。
唤醒沉睡知识主要是高效解决了提取、利用非结构化文档中的数据资料的痛点。例如,将企业招股书、财报、经济预测数据等文件上传后,天镜大模型可以深入解析金融领域专业术语、同时查询定位多个不同文档、洞悉金融图表隐含的信息和强大归纳总结能力。
众创数据价值主要是为了降低使用数据的门槛。天镜大模型SQL生成平台不再需要代码等专业指令,可直接向AI 说大白话,天镜自动理解需求、展开检索、生成答复,按照人的意思去完成数据挖掘的任务。
数字人方面,陆全希望打造的“数字外表+智慧大脑+情感内心”三合一数字人,擅理解,有温度,懂心理的智能秘书。员工在上传自己的资料并定制一些参数后,只需5分钟的训练数据就可以生成“另一个我”,代替完成大量工作。
在这样的技术前提下,以小额、分散、普惠为核心的消费金融,运营成本也必然会下降,从而打通从“普”到“惠”的道路。
对于马上金融推出金融大模型,欧洲科学院外籍院士、清华大学人工智能研究院常务副院长孙茂松表示,马上消费做了一个很好的示范作用,开了一个好头。
中国工程院院士倪光南则充满期待地说,“我十分期待你们在未来推动大模型应用在金融领域的探索和实践,从而带动和加速金融数字化和智能化的发展。”
前进的脚步不会停歇,对于未来,蒋宁表示,跑出“马上速度”的马上消费将持续拓展虚实共生,做可信开放的数字融合体。
