4月24日,在北京举行的第二届多样性算力产业峰会上,包括院士专家、三大运营商、科研机构、软硬件系统厂商等中国计算产业的近400名代表共聚一堂,共商“多样性算力”。
这次峰会最值得关注的,就是多样性算力产业及标准推进委员会(CCSA TC622,以下简称多样性算力推委会)的正式成立。
那么问题来了:多样性算力推委会成立的大背景是什么?多样性算力推委会的成立,又将对中国计算产业带来哪些深远影响?
多样性算力产生的大背景
数字经济时代,计算是数字经济的底座,数据是生产资料,算力是核心生产力。据信通院对全球主要经济体的测算发现,数字经济发展水平与算力规模密切相关,算力规模前20的国家中有17个是全球排名前20的经济体,算力已成为数字经济发展新引擎。
数字经济时代对算力的要求,一个是大,数据大爆炸需要充沛算力的支撑;另一个是多,多样性场景需要多样性算力的支撑。以最近炙手可热的ChatGPT为例,据Open AI研究,自2012年起,全球头部AI模型训练算力需求每3-4个月翻一番,每年头部训练模型所需算力增长幅度高达10倍。从GPT-3.0到GPT-3.5以及ChatGPT的优化主要来自算力的增加。ChatGPT 在微软 AzureAI 超算基础设施上进行训练,总算力消耗约 3640PF-days(假如每秒计算一千万亿次,需要计算 3640 天)。
说直白点,AI的发展的本质就是暴力算力。在这样的背景下,单一架构已经无法适应算力急剧增长的需求,因为摩尔定律几近失效,通用CPU性能提升受制,单核性能平均每年提升不到10%,算力无法实现普惠。
所以,多样性算力应运而生,以ARM、RISC-V等通用计算以及GPU、NPU、FPGA、DPU等异构算力,并行计算能力优越,具有高互联带宽,可以支持AI计算效力实现最大化,成为智能计算的主流解决方案。
多样性算力在我国的蓬勃发展,还有一个众所周知的原因,那就是推进自主创新的需要。面对复杂的国际形势,在计算领域需要通过多样性算力来保障多元化稳定可靠的算力供应安全,以支持各行业业务的平稳发展。例如,ARM架构具有独特的授权模式,而且我国的核心厂商也已经获得ARM v8的永久指令集授权,有助于构建稳定、安全的多样性算力生态。
众智与合力
推进多样性算力,关键在规模部署。中国工程院院士、清华大学计算机系教授郑纬民在演讲中指出,多样性算力的规模部署关键在于两方面:一方面是供给方做好软硬件协同和异构融合创新,释放多样性算力潜能;另一方面是需求方牵头构建一致性测评体系,以需求和评测牵引产品快速迭代,引导用户敢用、多用经过测评认证的多样性算力产品。
多样性算力推委会的成立,就是在这样的背景下诞生的。在推委会这个平台上,供需双方可以形成协作,共同推动多样性算力的高质量发展。
翻开多样性算力推委会的《管理办法》,在“总则”中明确提出:“本推委会旨在汇聚产业界力量,面向未来计算高能效、高吞吐、多核高并发、AI等算力诉求,促进相关主体之间的交流和深度合作,促进供需对接和知识共享,共建多样性算力产业体系,打造开放多元普惠的计算产业生态。”
最强的智是众智,最大的力是合力,多样性算力凝聚了中国计算产业的最强力量。这从其成员可见一斑。去年,推委会由清华大学、中国移动、中国电信、中国联通、华为、中国信息通信研究院、安谋科技(中国)、中兴通讯、新华三、飞腾、中信科等十一家单位发起成立。
近一年来,又有48家单位加入推委会,涵盖了芯片IP、运营商、设备数、整机、部件、基础软件厂商和科研院所。至此,多样性算力推委会的会员单位达到近60家,汇聚了计算产业链各方的领先企业和机构。
推委会也拥有我国计算产业最强的专家力量。峰会期间,由郑纬民院士代表推委会正式聘任倪光南院士、廖湘科院士和钱德沛院士为战略咨询委员会委员,为推委会的发展及重大事项决策提供指导。由此可见推委会的权威性。
产业协作平台,共筑数字底座
据了解,推委会有五个工作组,分别是需求架构组、技术规范组、测试验证组、应用推进组、产业合作组。从这五个工作组的命名就能管窥推委会的核心工作。
具体来说,推委会的工作方向包括:首先,是发布年度多样性算力白皮书。这可不是普通的行业报告,而是提供多样性算力的市场发展数据、技术趋势、优秀实践、共性问题和产业推进方向以及措施建议等等。可以说是多样性算力发展的阶段性晴雨表。
本次峰会由推委会副主席、中国电信研究院副院长陈运清发布的《多样性算力商用部署白皮书》就是很好的说明。该白皮书展现了中国电信、中国移动、中国联通三大运营商在多样性算力的商用部署案例。
中国电信天翼云的云平台底座搭载国内主流芯片、服务器、操作系统,打造安全可靠、全栈服务能力的央企专属云。天翼云“一片央企云”已经在北京、上海等全国多点布局,以北京节点为例,采用了鲲鹏、飞腾等多样架构国内主流服务器。中国联通基于ARM的某金融行业核心系统迁移案例,为客户打造全栈鲲鹏体系的国产替换解决方案,展示了运营商如何利用多样性算力,面向特定商业化领域进行服务支撑。
从案例来看,以ARM为代表的多样性算力逐步从可用走向好用。以中国联通的案例为例,经过场景实际测试,基于ARM架构的团险核心系统在契约批量导入、保全批量减人、保全批量加人、保全更换被保险人、理赔批量导入等场景上,处理用时大大减少。
其次,是制定多样性算力技术规范和流程、工具,包括多样性算力软硬件功能、性能、安全、测评等自愿性团体标准,产业新动向可行性分析研究,开发面向产业的多样性算力测评工具和IT平台。截止目前,推委会已经发布了包括《服务器管理Redfish接口规范2.0》、《基于ARM平台数据库迁移指南》、《服务器内部部件评测规范》等9份技术规范,在推进多样性算力标准化、规范化上发挥重要作用。
第三,是构建多样性算力测评与验证体系,开发和维护多样性算力的测评题库,进行实验室资质认定和授权以及测评规范和流程迭代看护。在多样性算力测评和验证上,“芯巢平台”值得介绍,其全称是芯巢多样性算力孵化平台,是通过以标准规范为牵引,以孵化迭代为途径,以产业推进为目的的一整套解决方案。芯巢平台是多样性算力测评体系的重要工具平台,在芯片测试上可以节约人力重复性工作,快速对芯片服务能力进行测评,验证多产品之间的兼容性满足程度。
此外,多样性算力推委会还包括举办产业峰会以及多样性算力最佳实践的分享。此次举办的多样性算力产业峰会2023就是这样,本次峰会主题为“共筑多样性算力 擎动数字经济”,有顶级院士、工信部领导出席,有三大运营商、科研和评测机构、智库、软硬件产业链厂商等代表出席,不仅在产业趋势等方面凝聚共识,而且分享了行业的创新成果、市场动态、最佳实践。本次峰会还围绕智算中心、算力网络、先进计算和基础软件生态举办了技术论坛。可以说是多样性算力推委会的一个重要交流平台。
总而言之,多样性算力的发展需要多样性算力推委会这个产业协作平台,而四大核心工作的推进,也将加深协作,共筑多样性算力这个数字经济的基座。
写在最后:中国计算产业扬帆远航
多样性算力推委会的正式成立,是我国计算产业具有里程碑意义的一件大事。
一方面,是可以牵引国内芯片等相关软硬件计算产品成熟度的提升,促进硬件兼容性、开源及商用软件的可靠供应以及迁移复杂度高等多样性算力规模商用阶段诸多痛点的解决;另一方面,是通过联合产业伙伴力量,凝聚最广泛的产业共识,构建和推动开放多元普惠的计算产业生态,保障我国数字经济的安全可靠和可持续发展。
郑纬民院士表示,多样性算力推委会未来将聚焦的工作包括:在标准引领上聚焦ARM体系整机和部件标准体系,丰富多样性算力供应和创新;开展智能计算体系研究,发展多样性AI生态;探索RISC-V新方向可行性研究,定义多样性算力未来演进,推动多样性算力走向更加好用。
可以看到,多样性算力推委会的工作正在步入纵深,我国的计算产业发展和生态推进也在走向发展的深水区。中国计算产业就像一艘数字经济时代的巨轮,正在乘风破浪、扬帆远航!