2021年03月24日
评论数(0)
进入2021年后,华为在开源AI生态方面可谓动作频频。
3月18日,华为 “昇腾众智计划”正式上线,推出了包含MindSpore数据增强算子、MindSpore模型等在内的140个项目需求,涵盖文本、图像、视频、自然语言、目标检测等热门领域。
有别于传统的项目分包形式,昇腾众智计划的主要对象是企业、高校和科研院所,以项目合作的形式不断丰富昇腾软件生态,项目完成后,将在昇腾开发者社区、MindSpore社区中面向所有开发者开放。
作为新一轮科技革命和产业变革的驱动引擎,人工智能早已上升为国家战略,成为全社会的共识。在这样的背景下,昇腾为何要选择以“众智”的形式加速生态布局?
在人工智能领域的全球竞赛中,中国已经是“领跑者”的存在。
根据国际咨询机构IDC的调研,中国以14.1%的算力占比领跑其他国家,也是全球范围内唯二算力占比超过10%的国家,可以说是名符其实的佼佼者。
伦敦经济学院教授许成钢也在《2020中国人工智能指数报告》中写道:中国的学术论文发表总量仅次于美国,其中期刊发表论文总量和引用总数都在近期超过美国,明显和其他国家拉开了差距。
然而这些成绩只是中国人工智能产业的A面,需要理性认识的还有B面的短板。比如在人工智能的算力领域,NVIDIA等公司的GPU仍使用较多的AI算力,中国企业还有不小的差距存在;在人工智能的算法领域,Facebook主导的PyTorch、Google主导的TensorFlow依然是最流行的开发框架。
倘若无法在算力和算法上夯实基础打造生态,即便拥有再高的算力占比、再多数量的论文和专利,中国的人工智能产业都存在“沙中之塔”的风险。为何会出现这样的局面?原因有二:
一是国内AI的起步相对较晚。以被视为人工智能“操作系统”的深度学习框架为例,国外的一些高校在2013年前后就开始研究,Google和Facebook先后在2015年和2017年进行布局,积累了规模庞大的开发者。而国内大多数的开源深度学习框架始于2020年,目前多半还处于深耕期。
二是缺少完善的生态产业链。NVIDIA在为自家的GPU适配深度学习框架时,主要的精力集中在PyTorch和TensorFlow;Google和Facebook在开发深度学习框架时,也将NVIDIA等企业的产品作为首选项。中国企业主导的算力和框架缺少足够的话语权,相对应的生态产业链也就无从谈起。
进一步思考,中国人工智能生态所存在的主要问题,都可以归结为人才问题。国内并不缺少像昇腾系列AI硬件等中国企业主导的算力的基础设施,也不缺少以MindSpore为代表的优秀深度学习框架,所需要的恰恰是AI开发者生态。
根据工业和信息化部人才交流中心的报告,目前国内人工智能产业有效人才的缺口高达 30 万,计算机视觉等前沿领域的人才供需比只有 0.09,已经属于极度稀缺程度。
倘若算上金融、制造等行业所需的应用型人才,国内AI人才的缺口可能有500万的规模,并且将随着人工智能的产业进程逐年增长。正是人才层面的庞大缺口,基础软件的薄弱和开发者生态的贫瘠,渐渐成了悬而未决的难题。
想要消除中国AI的B面,前提是找到培养优秀AI人才的路径。
华为推出的“昇腾众智计划”,会是解决人才短缺的一剂良药吗?
参考华为计算产品线副总裁、昇腾计算业务总裁许映童的观点:昇腾计算产业坚持“硬件开放、软件开源、使能伙伴”,希望通过昇腾众智计划汇聚产业界的技术中坚,通力合作,加速丰富昇腾基础软件生态,识别和培养优质人才,加快推动各行业智能化升级。
“昇腾众智计划”的推出,无疑隐藏了一些“私心”。
一方面,众智计划的项目主要基于昇腾基础软硬件平台进行,通过国内外优秀开发者的共同参与,迁移或开发围绕昇腾平台的算子、模型、行业参考设计等等,目的是提升昇腾基础软件的能力,进而增强昇腾产品与解决方案的整体竞争力,构建昇腾计算产业生态。
另一方面,通过“昇腾众智”的开发活动,可以在短时间内聚集一批优秀的开发者,深度参与到昇腾平台的软件开发中,熟悉昇腾平台的开发环境,发现工具、框架等方面所存在的问题,一同参与开源生态的构建,有利于通过实践迅速识别和培养一批优秀的人工智能人才,不失为发展昇腾核心开发者的良机。
同时需要看到的是,“昇腾众智”不只是一种开发模式的创新,也给出了聚集优秀开发者的方法,何尝不是快速弥补AI人才短板的新思路?
比如“昇腾众智”向高校和科研院所抛出了橄榄枝,这都是“智力资源”最大的聚集地,也是培养人工智能人才的主要渠道。2018年国内还鲜有高校开设人工智能专业,目前已经有200多所高校开设了相关课程,增长势头可见一斑。
再比如“众智模式”规避了封闭式开发的低效,也巧妙地克服了传统项目合作的高门槛,将一些轻量级交付的生态部件以众智的形式分发,为潜在的优秀AI人才提供“练兵”的机会,几乎可以说是激活国内稀缺“智力资源”的最佳路径。
华为此前已经和专家学者合作,联合出版了3本昇腾相关的教材,陆续在国内100余所高校开设昇腾相关课程试点,并基于“智能基座”产教融合协同育人基地,让昇腾成为高校理工科相关专业学生的必备技能。“昇腾众智计划”进一步让高校的学生们走出课本和实验室,深度参与到人工智能的应用场景中,无形中打通了人才培养的闭环。
确切的说,“昇腾众智计划”为AI人才培养探明了可行方案:国内并不缺少人工智能的氛围,也不缺少优秀的人才储备,需要的是正确的方法。
AI人才培养并不是什么小众话题,“昇腾众智计划”到底有何不同?
在回答这个问题之前,先来回顾下较为常见的三类AI人才培养方案:一种是联合教学,企业与高校合作开设一些课程;一种是以赛促学,即以比赛的形式激发学生对AI的兴趣;还有一种是定向培训,以就业为目的培养某个特殊技能。
以项目合作为基调的“昇腾众智计划”,显然是一种深思熟虑的谨慎选择,可以达成有别于传统AI人才培养方案的关键收效:才尽其用与拥抱开源。
才尽其用:
企业、科研院所和高校对应的是不同的开发项目,比如企业可以将自身的行业经验和人工智能融合,进行一些行业参考设计和模型的项目;科研院所可以借助前沿研究的优势,进行算子、模型等方面进行创新;高校的学生可以参与一些轻量级的项目,甚至是以研究课题的形式加入众智项目。
在以往的AI人才培养方案中,由于普通高校学生缺少深入研究的基础,被引导的方向常常是应用型人才,“昇腾众智计划”给出了新的可能。
比如以“老师+团队”的方式承接众智项目,老师的作用是对团队成员进行分工,制定可实施的项目方案,学生根据分工攻克不同的课题。在这样的合作机制中,学生的空间不再是应用层面,可以提前接触人工智能的核心领域,对技术有着更加深入的理解,对未来的升学或求职都是很大的加分项。
拥抱开源:
和传统外包模式最大的差异,“昇腾众智”的所有项目都是以开放为目的,帮助伙伴和开发者高效使用人工智能能力。看似只是昇腾加速自身生态建设的激励计划,其实也在点燃中国AI开源生态的星星之火。
国内的AI人才不应该只有按部就班的教学,还应该引导学生们拥抱开源文化,在开源的氛围中通过与其他开发者的分享交流,不断扩展自己的认知边界和技术边界,构建“群智协同”的创新模式。“昇腾众智计划”在某种程度上也是面向开发者的“召集令”,比奖金和荣誉更有价值的,恰恰是为开发者打开开源的大门。
再来审视“昇腾众智计划”的价值,不单单局限在昇腾生态的层面上,不仅为昇腾生态的丰富找到了一条“捷径”,也为培育中国AI的开源文化探索了新的方向,同时为国内AI人才的培养按下了“加速键”。
截止到目前,“昇腾众智计划” 已有浙江大学、上海交通大学、西安交通大学、中国科学院等超过40所高校和科研机构参与(排名不分先后),超过440位开发者加入众智项目中,预计接下来将有2000多位开发者加入其中。
可能从体量上来说,目前“昇腾众智计划”的影响还比较有限,但从AI人才培养的维度来看,这是一场不应被低估的尝试:500万人才缺口所背负的不仅仅是一个个空缺的岗位,还有旺盛的AI落地需求无法被满足,在这场和时间赛跑的争夺赛中,我们迫切需要AI人才培养的新范式。