您的位置:  首页 资讯 运营 查看资讯

中国移动钱岭:算力的昨天,今天与明天

中国移动钱岭:算力的昨天,今天与明天


作者:C114通信网  焦焦类别:[ 运营 ] 2024-09-29 11:14:00  来源:C114通信网  焦焦


C114讯 9月29日消息(焦焦)数字经济时代,算力就是核心竞争力;但在先进制程工艺受限的当下,我们应该如何去看待算力,发展算力,用好算力。在近日召开的“中国移动第五届科技周”系列活动上,中国移动集团级首席专家、云能力中心创新中心总经理钱岭,作了精彩的讲解。

算力发展需要高质量

数字经济已成为继农业、工业之后的主要经济形态和增长引擎。“十四五规划”将“加快数字化发展,建设数字中国”单列成篇。到2025年,数字经济核心产业增加值占GDP比重达到10%,数字经济占GDP比例将超过50%。

算力则成为数字经济发展的关键底座和重要推力,根据《2022-2023全球计算力指数评估报告》估算,有效算力指数平均每提高1%,数字经济和GDP将分别增长约3.6%和1.7%。

从算力的建设水平来看,经过近25年发展,中国数据中心算力建设已达到世界第二。截止2023年,算力已达到230EFLOPS,智算占比30%。即便如此,算力系统的建设和运营仍不能满足数字经济发展的要求。

如今,数字化转型对算力和网络融合提出更高要求:数字化转型既要更强智能算力,还要绿色节能,又要保证算力利用率,也要充分发挥网络能力。这对异构算力全局调度、算力使用效率、算力和网络匹配、应用现代化和智能化、内生安全等提出了更高要求!总言之,算力和网络必须高质量发展,形成新质生产力,助力数字化转型,推动数字经济发展。

算力统一纳管调度 算力网模式将成为主流

在数字化转型的过程中,打破“算力孤岛”是关键。围绕着这个问题,钱岭作了深刻阐述。

挑战1:各种高性能算力并存,如何协同融合解决真实问题

钱岭认为,算力互通问题归根结底是硬件问题。目前主要有三种算力,钱岭形象的把这三种算力概括为昨天的算力、今天的算力和明天的算力:已大规模商用的以CPU为代表的通用和超算算力,即昨天的算力;正在大规模建设的以GPU为代表的智能算力,即今天的算力;正在科研攻关的以QPU为代表的量子算力、以OPU为代表的光计算算力,也即明天的算力。

其中,通用算力可支持百万台组网,属于中等能耗,目前已经很成熟。如果缩小制程可以大幅降低能耗,但难度很大。智能算力可支持十万卡组网,但高能耗,目前成熟度居中,没有几家企业可以做到,主要原因是电力受限。量子计算属于低能耗,目前能达到单机水平,但噪声很大。光计算算力能耗低,但不成熟,目前处于推理阶段,算力整合是大问题。

挑战2:如何构建全国范围算力和网络资源统一调度能力

统一调度主要是系统软件和云网融合问题。用户需求很多,云智量融合中心的任务是提升算力能力,优化算力组网以及算力统一调度。统一调度可以提升整个算力的利用率水平、能效水平,以及整个系统的软件调度能力水平。

挑战3:如何实现应用现代化以支持新型算力和网络基础设施

近20年,应用架构已经经历了SOA、云原生、云数融合(Lambda等)、微服务和Serverless等多个阶段,新型架构让应用可以充分利用云计算、大数据等基础设施,实现资源的高效利用(应用现代化)。

算力网络在满足算力高质量发展的同时,也对应用架构提出了新的变化,目前已经可以看到算网原生(应对分布式云)、任务式(应对利用率)、云智融合(应对AI)、量超融合(应对量子计算)等多种范式。但目前而言,实现应用现代化还很难,需要时间。

为应对三大挑战,实现异地异属异构的算力统一纳管调度,提升利用率,对客户提供普惠易用的算力服务,国家先后发布相关政策,目标是构建高质量一体化算力网,产业各方基于各自基础积极探索算力网构建模式。

政策指引上,整体形成四个阶段:第一阶段,东数西算;第二阶段:算力基础设施高质量发展,明确算力基础设施未来三年的发展指标要求;第三阶段:构建全国一体化算力网,明确鼓励和支持运营商发展新型算力网络;第四阶段:推动新型信息基础设施协调发展,要求提升算网资源统一管理、统一调度和智能编排等能力。

在政策指引逐步明确的情况下,产业各方的示范实践也随之逐步深化。主要的探索实践模式有三种:模式一,企业建设和运营,把公有云演进为算力网络,例如中国移动算力网络;模式二,科研机构的建设和运营,把超算中心转型为超算互联网;模式三:政府建设和运营,将政务云转型为公共算力服务中心。但钱岭认为,一个国家不应该出现多种模式,这三种模式在市场化的引导下会并行一段时间,但最终只有一种模式成为主流。

中国移动算力网络的三重实践

钱岭介绍,中国移动2021年发布《算力网络白皮书》,核心理念是以网强算推动算网融合发展,最终使算力成为与水电一样,可“一点接入、即取即用”的社会级服务,实现“网络无所不达、算力无所不在、智能无所不及”的目标愿景。

算力网络是以算为中心、网为根基,网、云、数、智、安、边、端、链(ABCDNETS)等深度融合,提供一体化服务的新型信息基础设施。算力架构包含三个部分,分别为:算网基础设施、算网大脑和算网服务入口。在算力架构的三个体系下,中国移动做了大量工作。

首先,在算力基础设施方面,中国移动所做的三大重要工作:

1、中国移动构建并打造了通算和智算两大算力高峰,超前布局量子计算。在云计算/通算方面,中国移动完善“4+N+31+X”中心算力布局,推进边缘算力下沉,丰富终端算力产品体系,形成云、边、端多层级全国性基础设施。算力规模达88万台。在智算方面,中国移动加快构建“N+X”智算资源布局,形成“中心大集群、边缘广分布、中训边推、训推一体”的基础设施体系,支撑大模型发展,算力规划为超7万卡,目前已经建成超过50%。在量子计算方面,中国移动联合量子产业各方,加速开展“五岳”量子云平台研发、建设和并网,已商用并网8台各种制式量子计算机,规模达到590量子比特,处于国内领先地位。

2、强化网络优势,构建弹性立体网络,实现跨域确定性互联。中国移动深度探索各类算力资源的网络需求,创新性构建以云专网为核心的入算、算间融合立体网络,支持网络多元接入、极速开通、极致弹性、广域覆盖、灵活定制,实现跨域确定性互联。

3、面向客户需求,算力种类和能力互补,并网社会算力。为丰富算力供给类型,盘活社会闲置算力资源,中国移动建立算力并网商业模式,开展百川并网行动,创新三类并网模式,汇聚通算、智算、超算、量子算力四类社会算力,实现多方算力资源服务互补,满足客户多样化需求。

其次,在算力大脑方面,中国移动开展三项主要工作:构建算力和网络的智能感知、编排和调度中枢。算网大脑重点布局算网统一感知、多要素融合编排、算网统一调度、服务一体化供给能力,是算力网络发展关键。中国移动历时三年,算网大脑从概念变成产品,实现三个三分钟:分钟级感知、分钟级调度、分钟级编排。

在感知能力上,中国移动构建了维度全、要素多、准实时动态算网地图。算网地图统一管理算力、存力、运力、能效4大类20+维度指标,全面覆盖42个通算资源池、13个智算中心、10+智算/超算、25万+网络链路,实时监测超百万资源实例,实现TB级/日指标数据实时处理,全面支撑算网资源精准调度。在调度能力上,中国移动实现了大容量、准实时算网调度,低价获得闲置算力。中国移动当前已实现亿级/日调度性能,提升链路资源利用率30%,云池资源利用率35%,平均节省客户成本20%。

最后,在算力服务方面,中国移动的产品丰富度行业领先,解决方案全场景覆盖,专业服务贴近客户。

中国移动目前算网产品数量达230+款,构筑品类齐全的全栈产品能力,产品丰富度位列云服务商第一阵营,同时基于重点产品和行业发展需求,打造行业解决方案,为用户提供一站式产品服务。

中国移动算力网络三大标杆项目解析

钱岭在会上还特别分享了中国移动三大标杆项目案例。

标杆案例1:中国移动算网大脑能力输出:服务国家一体化算力体系建设,基于算网大脑构建业界首个通算、智算、超算、量子算力“四算合一”的长三角芜湖枢纽公共算力服务平台,实现集约化、服务化、智能化的新型算力服务供给体系,打造“一点建设、服务全省、支持全国”的算力公共服务平台示范标杆。

标杆案例2:使能“数据快递”创新服务,实现大型数据低成本传输。中国移动弹性网络能力输出:为解决东数西算、智算超算并网等数据流转难的问题,基于算网大脑开发“数据快递”服务,实现网络可按需连通,带宽可弹性伸缩,资源可全局调度,服务可按量计费,全面支持任务式需求,将广泛应用于离线渲染、模型训练、跨域迁移等场景。

标杆案例3:实现超算中心、智算中心算力并网(百川并网)。以中国移动移动云和算力网络为中心,为盘活社会闲置算力资源、丰富算力供给类型,建立算力并网商业模式,开展百川并网行动,汇聚整合社会及内部单位多类型算力,实现多方算力资源服务互补,满足客户多样化需求。

会议最后,钱岭总结到,自2021年中国移动提出算力网络全新理念以来,从基础设施布局、算网大脑创新、算网服务运营等多方面推进算力网络进展。不仅自建算力网络,还将算力、网络和大脑能力输出,助力多省公共算力中心、超算中心、智算中心改造,推动全国一体化算力网建设,助力数字化转型。在谈及未来发展时表示,钱岭表示,未来中国移动将探索超、智、通、量四算融合,传统信息网与量子安全网互联,“四算两网”融合发展,以此赋能创新新型算网应用,探索算力网络“未来+”。


微信扫描二维码

发表您的评论吧

相关阅读