解码元翌智能:昇腾AI创新大赛金奖得主的技术拼图
过去两年里,大模型可以说外界讨论最多的技术话题,且几乎每一次都会出现这样的疑问:大模型的价值到底在哪里?
不少人曾尝试给出答案。
在日常工作中,生成式AI的能力渐渐成为一种标配,写文案、生成图像、文本翻译、编程等应用越来越成熟。
在日常生活中,一个个智能体深度影响了人们的生活,酝酿出了聊天对话、图生视频、帮点外卖等新奇玩法。
不久前举办的昇腾AI创新大赛,从另一个角度进行了回答:在千行万业的细分场景中,大模型正在和产业需求深度融合,通过破解阻碍行业发展的技术性难题,迸发出了实实在在的新质生产力。
比如用大模型实现遥感影像解译的元翌智能。
01 被解译环节“困”住的千亿级市场
目前全球在轨运行遥感卫星达1659颗,其中中国已经发射451颗,并且高分系列遥感卫星的分辨率已经提升至亚米级,被广泛应用于国土资源与环境监测、农作物监测与估产、森林碳汇估算等领域。
根据中国地理信息产业协会的数据,2023年国内地理信息产业总值达到了8111亿元,约是2015年的2.3倍。参考卫星遥感信息服务10%左右的占比,等待商业遥感的将是一个千亿级的蓝海市场。
按照上中下游的模式拆解遥感产业链:上游是数据生产,即遥感卫星的数据采集;中游是数据处理、地物监测信息等服务,直接关系到产业前景;下游是农业、林业、国土、测绘等应用需求。
当前被限制的,正是中游的解译环节。
遥感卫星获取到的信息,通常是以复杂的光学或雷达信号形式呈现的,需要将信息解译成可理解、可应用的形式。
其中的难点在于,不同复杂场景的多模态观测机理差异大、地表要素解译受自然/人为因素影响大、复杂多样的地表要素特征变化大,导致大规模遥感数据处理平台建设与共享等方面存在诸多困难。
譬如国内在测绘、国土、林业、农业等行业遥感调查与更新,主要采用的还是人工目视解译的工作方式,耗时、费力、成本高、周期长,无法满足快速提取与更新的需求,直接制约了商业遥感的市场应用。
打一个比方的话:遥感卫星拍摄的地球图像就像是对地球表面做了一次“体检”,记录下了各类“身体指标”(比如植被覆盖率、水体分布等),解译人员就像医生,通过经验和专业知识分析“体检数据”,找出重要的信息(比如哪里是森林、哪里是城市、哪里可能存在问题)。摆脱对人的依赖,将是商业遥感爆发的核心一环。
为了改变人工解译的低效局面,国内外学者在2013年就开始深度学习方法进行智能遥感解译的研究,涉及目标与场景检索、目标检测、地物分类、变化检测、三维重建等,而且部分成果达到了实用水平。
问题在于,遥感影像比目标识别复杂得多,特别是自然地物分类方面,一直无法满足业务化的应用需求。
好在向AI要解法始终是遥感产业上下游的共识,其中就包括西安电子科技大学的人工智能学院遥感大数据解译团队,在卫星遥感领域深耕了20多年,近五年获省部级一等奖3项、获得国际国内竞赛冠亚季军100多项、发表论文250余篇、获批专利100余项,一直在寻找技术解决方案。
02 智算中心“埋下的种子开出了花”
时间来到2021年9月,位于雁塔区的西安未来人工智能计算中心正式上线,可提供300P的昇腾算力。
同样是在2021年,西安电子科技大学人工智能学院遥感大数据解译团队在华为的支持下入驻智算中心,带着“让遥感赋能千行百业”的愿景走出实验室,创办了陕西元翌智能科技有限公司。
和AI的数据、算法、算力三要素相似,遥感影像解译也有三大核心要素:遥感影像样本数据库、遥感解译大模型和大规模计算中心。到了2022年,用大模型解译遥感影像的条件越来越成熟。
在遥感影像样本数据方面,国内高分系列卫星提供了超过300万+平方公里遥感数据,训练数据总量超过100T;在算力资源方面,西安未来人工智能计算中心的智能算力,提供了充沛的算力资源。
元翌智能开始研发元翌遥感影像解译大模型,针对广域场景遥感影像解译、大规模网络并行训练等难题,设计了大场景预处理、地物要素提取、变化检测等专用算子,并在技术架构上进行了一系列自主创新。
一个是全要素提取方案,针对地物类别不均匀、数据跨度大、实时解译困难,元翌智能构建了任务决策引导的可解释学习框架,实现了人造地表要素、林草地要素、耕地要素、灾变要素等复杂场景下的全要素提取;
另一个是复杂场景多要素高精度综合解译,元翌智能团队基于地学知识图谱构建了场景多要素复合关系模型,通过场景知识和解译知识的因果推断,实现了立体交叠、平面交织等多要素冲突下的判别和消歧。
集齐了“天时、地利、人和”的元翌智能,通过元翌遥感影像解译大模型交出了一份亮眼的成绩单:
通过多层次的解译体系,能够覆盖100+类别地物,实现大规模数据的精准分析;实现广域真实场景下多任务并行高精度实时解译,而且平均解译精度达到了85%以上;原本至少需要1人·月的亿级像素遥感影像,现在只有10分内就能完成解译工作。
深谙遥感产业现状的元翌智能,让遥感产业告别陷入困境的同时,还打通了大模型落地的“最后一公里”。
相对应的是元翌智能的大模型架构体系:面向全域全要素的L0基础大模型,关注给定区域内所有与生产生活相关的地物要素,可满足国土测绘调研等需求;面向特定领域的L1行业大模型,可满足农业、林业、水利等不同行业的地物要素需求;面向精准场景和特定要素的L2场景大模型,可以满足农作物分类、铁路沿线安全检测等个性化需求……进一步打通了商业遥感的可行路径。
03 释放智慧遥感产业的“无限可能”
近十年里,国内在遥感领域累计投入的经费超过3600亿元,遥感卫星的数量占到了在轨卫星的60%以上,仅民用对地观测卫星每天接收的原始数据就超过了10TB。
但相当长的一段时间里,遥感的价值并不被外界所理解。
打破了遥感图像“解译”瓶颈的元翌遥感大模型,疏通了遥感产业上下游的堵点,让上游的数据价值被发挥出来,下游的迫切需求得到了满足,释放出了隐藏在智慧遥感产业背后的新质生产力。
比如在自然资源监管方面。通过分析不同时间点的遥感影像,可以对某地区的自然资源变化进行监管。
陕西省渭南市临渭区是国内著名的猕猴桃产区,当地主管部门利用元翌遥感影像解译大模型进行了猕猴桃地物种植区域识别的微调工作,对全域约6.7万亩猕猴桃种植区域进行精准解译,精度高达95%以上,极大地缩短了对不同种植阶段猕猴桃种植区的长势特点的考察时间和成本。
比如在生态文明建设方面。通过分析一段时间里的自然环境变化,为生态环境的精准检察提供数据参考。
西安市秦岭生态保护局使用元翌遥感影像解译大模型监测了秦岭光头山2015年到2022年的生态环境,监测草甸、植被、树木、建筑物、道路等地物要素的变化情况;相似的一幕还出现在陕西省人民检察院对安康旬阳矿区的监测,监测耕地、植被、河流、大小道路等地物特征的变化。
再比如灾害应急管理方面。借助遥感图像进行洪灾监测和评估,或者是地震、泥石流等灾情的紧急分析。
2023年8月,西安沣峪口发生了洪涝灾情,陕西省应急厅与陕西省高分中心协调获取了灾后高分系列卫星数据,借助元翌遥感大模型进行解译后,用来分析主要受灾点的情况,对灾情反馈、道路抢修以及居民安置起到重要参考作用,为灾害应急的科学管理和部署提供了准确的数据支撑。
可以找到的案例还有很多。
或许对于很多人来说,“遥感大模型”的概念依旧比较陌生,但距离我们的生活并不遥远,在环境监测、灾害预警、城市规划等社会的方方面面,都离不开“遥感大模型”的身影。
这样的创新者,不应该被“埋没”。
2024年5月初,昇腾AI创新大赛2024正式启动,元翌智能的“元翌遥感影像解译大模型解决方案”,凭借在大模型领域的自主创新和落地应用的生产力跃升,一路过关斩将,先是拿到了陕西赛区的金奖,最终站在了2024昇腾AI创新大赛全国总决赛的领奖台——斩获企业赛道原生创新组金奖。
04 写在最后
属于元翌智能的故事远没有结束。
接下来的日子里,元翌智能将继续迭代更新L0级基础模型,优化基础解译算法的准确性;升级L1级行业大模型,优化解译算法的行业适应性和准确性;完善L2级场景大模型,增强复杂场景下的动态更新能力。
也让我们有理由相信,在元翌智能等企业的创新驱动下,商业遥感的千亿级市场将被进一步挖掘,让更多行业分享到创新的红利。
