科技云报到:算力之后,“存力”上位

科技云报到 原创

2025-06-18 17:04

科技云报到原创。

当算力芯片的摩尔定律逐渐逼近物理极限,存力开始从幕后走向台前,成为AI领域下一个关键赛点。

长期以来,伴随企业数字化转型所建设的“烟囱式”AI基础设施各自为战,数据奔流,价值却困于“堰塞湖”。随着大模型参数量突破万亿级、训练数据迈向EB级,传统存储架构短板日益凸显。正如石油需要炼油厂,AI时代的数据亦需专属的“存储引擎”。

中国信通院《新型人工智能存储研究报告(2025年)》指出,AI存储是大模型的关键支撑,直接影响数据处理效率、成本与安全。存力中心作为新型的数据基础设施,正成为AI时代数据流通和融合应用的破题关键。

AI时代的“数据决定论”

AI技术的发展离不开三大要素:数据、算法和算力。从ImageNet的1400万张图像到GPT-4的45TB文本数据,海量的多模态数据为AI模型提供了丰富的训练素材。

根据《数据存储2030白皮书》预测,到2030年,全球每年新产生的数据总量将超过1YB,增长速率远超存储容量增速。

然而,中国仅有3%左右的数据被有效保存,数据存留率只有美国等发达国家的三分之一。海量数据如指间流沙般“产而未采、采而未存”,其中蕴含的巨大价值最终消散于无形。作为AI时代的“燃料”,数据若存不下、用不好,再强的算力也如同无米之炊。

正如华为公司副总裁周跃峰所言,我国迈向数据强国的进程中,其关键已超越数据规模的单纯积累,转向对数据质量的深度聚焦。如何打造高质量数据资产供给能力,如何让数据要素高效按需流通,这将直接决定国家和企业在数字经济浪潮中的核心竞争力。

AI时代存储市场的三座大山

随着AI技术持续突破,构筑更高效、更可靠的AI存力底座成为大势所趋。当前,存储市场正在经历三个全新变化,主要聚焦在效率和成本方面。

第一,AI大模型向多模态演进,训练数据包括互联网爬虫、AI语料库和大数据平台等多种来源,数据类型和格式也各不相同。在数据归集过程中,存储系统需要提供多协议支持和免数据拷贝功能,以确保高效的数据处理和利用。

第二,在数据归集和预处理阶段,通常涉及大量小文件读取,因此要确保数据能迅速读取。在训练时,为防止任务异常中断后从初始状态重新开始,保存训练过程中的检查文件尤为重要。

第三,长序列推理时,计算复杂度随序列长度而增长,内存占用与算力消耗激增,推理速度与成本间形成“效率低、成本高”的剪刀差,如何降低大模型推理成本、提升推理效率,将影响大模型的行业应用进程。

想要引发千行万业的AI变革浪潮,需要有与之相配套的存力基础设施支持。为此,存力无论从供给水平还是技术创新能力方面,都要有所创新和突破。

新型AI存储成为行业应用落地新引擎

在AI时代,存力战略价值已不容有失。存储技术的持续创新将加速行业变革,成为千行万业AI落地的战略新引擎。

AI时代需要与之匹配的新型AI存储。对于何为新型AI存储,《新型人工智能存储研究报告(2025年)》中提到,新型AI存储具备极致性能、数据安全、大模型数据范式、高扩展性、数据编织和绿色节能六个关键特征,是AI基础架构不可或缺的组成部分,从数据归集、训练与推理三方面,推动AI应用落地:

  • 对于数据归集,数据编织技术整合多源业务信息,支持用户随时随地通过任意终端访问所需数据。通过兼容多种存储协议,在提升数据跨域调度效率的同时,大幅降低数据治理成本。

  • 在训练方面,高性能并行文件系统可以提升大模型训练效率,超大带宽和容量支持超万卡集群无瓶颈扩展,EB级扩展能力适应海量数据,加速卡直通技术使数据从存储到算力“一跳直达”。

  • 在推理方面,通过KV Cache多级缓存机制,让大模型推理具备长记忆能力,能记住对话历史和工作上下文,避免用户反复解释和模型重复计算,在提升大模型应用体验的同时,降低大模型推理成本。

新型AI存储助力金融、制造等领域加速数智化转型。以医疗为例,某医院选择新型AI存储提升病理大模型的推理速度。在诊断胃癌过程中,能够帮助医生快速对比癌变区域与正常黏膜的特征差异,精准评估病灶风险,有效缓解医生因人工对比带来的工作负担。

构建AI时代新型“数据粮仓”

与算力聚焦在“算”不同,数据存力聚焦在“数”和“存”,是数据生产要素处理的综合能力体现,肩负着为数字经济各种场景提供源源不断的“生产资料”的使命。

存力中心围绕数据汇聚、存储、治理、开发、利用、供给等数据全生命周期流程,完成从数据资源到智能价值的高效转化,其不仅承载着大规模数据的存储需求,也对高效数据处理、分析、挖掘等技术领域起到支撑作用,推动从分散的小规模数据向规模化、融合化的数据发展,成为AI时代的“数据粮仓”。

周跃峰曾表示,AI时代首先要做到数据Ready。近两年,从国家到地方、从行业到企业,正在加快存力中心的建设步伐。华为扎实做好数据工程研究和技术创新,和各行业伙伴紧密合作,推动我国存力中心集约化建设,为AI落地提供助力。

比如华为参与建设的贵州主枢纽存力中心暨数据要素保障基地,具有50PB的存力规模,实现了数据智能分级、可信数据空间的构建以及数据跨域编织,以提高数据的安全性和可用性,以数据赋能带动了本地产业发展。

AI大模型正倒逼存储技术创新。将目光投向更长远,新型AI存储很可能是撬动人工智能时代杠杆的另一个支点,“以存强算”“以数助算”亦是弯道超车的重要落点。当AI产业具备扎实的存力底座,才能登高远眺,看见AI时代最美的风景。

【关于科技云报到】

企业级IT领域Top10新媒体。聚焦云计算、人工智能、大模型、网络安全、大数据、区块链等企业级科技领域。原创文章和视频获工信部权威认可,是世界人工智能大会、数博会、国家网安周、可信云大会与全球云计算等大型活动的官方指定传播媒体之一。

特别声明
本文为正观号作者或机构在正观新闻上传并发布,仅代表该作者或机构观点,不代表正观新闻的观点和立场,正观新闻仅提供信息发布平台。
最新评论
打开APP查看更多精彩评论

微信扫一扫
在手机上浏览