2021年08月23日
评论数(0)
作者 | 龙老师
出品 | 子弹财经
什么是大装置,这甚至是一个百度百科里没有的名词。
直到「子弹财经」找到中科院近代物理所的网页,才搞清楚何为大装置——大装置的全名是“大科学装置”,是指建造技术难度高、规模大,能支撑某科学领域进行长期稳定的科学研究活动,以实现重要科学目标的大型科研设施。
一般来说,大科学装置都是以举国之力进行建造的,这是往昔大装置建设的一个特点。因此,商汤提出的AI大装置的说法,首先要证明自己真的是“大装置”,其次,要证明它能够长期推进科技创新,实现重大的科研成果。
或许我们可以这么理解,商汤的AI大装置也是中国首个民营企业建造的大装置,它不仅仅打破了“大装置只能由国家建设”的固有概念,反映出中国民营企业在基础科学研发上的前沿进展,同样也意味着,由企业建设的大装置,能更好的直接服务于经济领域并产生综合效益。
SenseCore商汤AI大装置是充满魅力和想象力的,让我们一起来了解。
美国科学哲学家托马斯·塞缪尔·库恩的《科学革命的结构》是科学哲学的经典之作,他成书的主要背景是,第二次世界大战结束后,科学技术的突飞猛进催生了一系列的理论与技术创新,促使科学技术日益整体化,学科间相互交叉渗透的趋势大大增强,人类文明史和认识史进入一个重要的时期。
其中,最重要的特征是——上世纪中叶以前的科学,更多地表现为个体劳动的特征(小科学);现代科学技术的发展,促使这种劳动方式发生改变,它使科学制度化、专业化和集约化的程度大大提高(大科学)。
每个历史时代,都会出现一些代表性的科学成就,而人类作为一个共同体,认同这些代表性成就后就会形成共识,并成为一定时期内进一步开展社会活动、科学活动的基础,这也是大装置产生的历史背景,即商汤的大装置来自于人类将进入智能经济社会的共识。
每个时代、每个领域都有自己不同大装置,1946年,人类第一台计算机ENIAC发明出来的时候,科学家们说,有5台就可以解决全世界的计算问题,这时候ENIAC就是那个时代的大装置。
然后人类有了超算,有了电子对撞机,中国人有了两弹一星、有了天眼,这些都是不同时代、不同领域的大装置。
可以说,商汤的AI大装置,本质也是在为探索未知世界、发现自然规律、实现技术变革提供极限研究手段,是科学突破的重要保障,也是社会虚拟化加速的底层推进器。
而且,商汤科技联合创始人、CEO徐立对大装置的定位也非常清晰,「子弹财经」记得很清楚——2017年5月,商汤科技创立之初有一次关于企业文化的探讨,徐立当时发言说——经过大约半年的思考和提炼,有了一个初步的想法,那就是商汤的使命是“让人工智能引领人类进步”,徐立希望这是商汤存在的意义。
而从今天商汤大装置的落地,可以看出这个使命正在被践行,被变成事实。
有人说中国已经有了非常多的超算,AI大装置解决什么新问题?我们可以看到,过去很多代的超算在硬件层面逐渐自主,但软件层面还比较粗糙;商汤的大装置,则是一个从底层算力到上层应用、模型库(工具箱)都很齐备的体系。
这里略微科普一下商汤AI大装置的三个层面。
第一层是算力层。这里的算力层不仅仅是CPU或者GPU的集群,而是一个可以包罗万象的体系,这里面除了通用的GPU以外,还有AI专用芯片(比如计算训练的芯片)、新型人工智能计算中心(AIDC),以及分布广泛的大量底层传感器,简单说就是,这里有超级算力、超级存储和兼容各种硬件的底层逻辑。顺便说一下,要实现这种大整合非一家所能,所以商汤联合清华大学、复旦大学、上海交通大学、中国信息通信研究院及行业伙伴共同成立了“人工智能算力产业生态联盟”,我们可以相信,这个联盟会将解决对各种硬件的兼容,以及从软件到硬件做更好的集成和算法的优化。
目前,商汤AIDC计划总算力为达到3740 Petaflops的计算能力(1peta表示10的15次方,即千万亿次,所以1Petaflop等于每秒1千万亿次浮点运算)。
第二层是平台层,我们可以看做是整个大装置的中台,这里集中了解耦后再具象的各种AI能力模块,其中包括数据平台、训练框架、加速模块以及模型生产平台。其中,训练框架是商汤自主原创的深度学习训练框SenseParrots;加速模块是商汤高性能计算引擎SensePPL,使我们能更好地使用好分布式的数据和硬件加速。
第三层也就是我们熟悉的算法层,你可以看做是一个工具箱——算法层提供可以直接使用的算法模块。很多场景有复用的模块,一些问题不需要重复解释,可以直接从工具箱拿取需要的算法,商汤的算法工具箱里已经有21000个算法模型。
所以,我们基本可以概括地说,商汤的AI大装置解决了两个问题:
第一个,是底层有了更合适AI计算的硬件能力,这个设计是为AI专门打造的;
第二个,大装置的本身是为了AI更前沿的探索,可以简单说是——能制造AI的AI装置。
现在人们都在呼唤有更好的通用人工智能,但很少人知道,为了一个模型的成熟,需要许许多多次的尝试——很多通用模型在设计的时候其实都是一次对于资源的冒险,需要调动成千上万的GPU,顺便讲个典故——谷歌当初为了某个超大模型的训练,甚至停掉了自己的数据中心。而商汤要解决的,是需要通过去尝试不同的、超大模型来达到卓越的泛化能力,而大装置就是为了生产出AI的AI装置,我们可以简单理解为,它是AI的工作母机,是人类探索AI的星际飞船。
略微夸张一点,商汤AI大模型从本质上,是“阿波罗登月计划”、兰州重离子加速器等一个层面的东西,从调动的社会资源层面和规模或许稍有不如,但结构层次上相仿。
前面说过,人们对每个时代发展的科技主范式形成共识,是推进这个时代主流科技发展的前提,而商汤AI大装置就是基于智能经济时代必然到来这个社会共识产生的,它的意义比它的名字对我们更有深远的意义。
还必须提到的,大装置还需要大量的人才才能应用起来,徐立对此是非常有信心的,他在2018年接受《经济观察报》采访时说,要想吸引顶级的AI人才,有两大法宝。一是工具的提供,二是环境的营造。
他引用古语说:“工欲善其事,必先利其器。”科学家需要什么呢?需要工具。以前,商汤之所以能聚集一批人才,首先做的就是搭建了一个非常好的底层系统,深度学习操作系统,现在又有了大装置。可以说,这一软一硬两套法宝,能够吸引足够多的AI人才来此建功立业。
而对于环境的营造,徐立表示过,科学家往往都是扎堆出现的,当你成为这个领域的技术大牛时,你的周围往往也会是同类的技术大牛环绕,因为技术大牛们在一起,讨论一个问题,便很快能碰撞出新的火花。商汤科技便成了技术大牛的集聚地,也打造了自己的核心壁垒。
元宇宙的话题最近非常火,而商汤科技联合创始人、CEO徐立在WAIC 2021上发表的主题演讲——打破虚实世界次元壁,让我们觉得这个演讲标题离元宇宙非常近。
元宇宙(Metaverse)这个词在1992年出现在美国著名科幻作家尼尔?斯蒂芬森(Neal Stephenson)的小说《雪崩》里,它指的是物理现实、增强现实和虚拟现实三种模式,在共享的网络空间中相互融合的一种状态。
换句话说,元宇宙的时代,必须把数字虚拟世界叠加到现实场景中,而当这种叠加充分融合时,就会出现徐立提到的场景——虚实世界的次元壁被打破,虚拟和现实出现融合,虚拟和现实不再是对立的两个词汇,而是合成为一个新的世界的AB面。
也许这么说非常的抽象,但是对商汤来说,这一切已经是正在进行中的事实。说得透彻一点的话,虚实结合是创造元宇宙的一个基本方法,而大装置加速了这个进程。
元宇宙不是一天就能搭建的,科学家对此有各种程度的划分,总体来说,越到后面就可能越接近《头号玩家》里的那种场景,当然,那是一个很消极的世界观的映射,我们并不希望人类发展到那样一个状态。但这个片子也呈现了一个基本面,就是虚实高度结合后的世界有可能是一种什么形态。
但从现在走到元宇宙的路是很漫长的,商汤是非常务实的企业,所以我们选择了一个非常切合当下实际,有想象力但又不是遥不可及的切口,那就是我们现在的混合现实平台。
具体说来,为了把虚拟和现实打通,商汤为此打造了一个企业级平台,称为SenseMARS火星混合现实平台,简单来说,这个平台能够链接大量基础硬件设施,包括手机终端、loT设备,AR/MR眼镜。并为诸多现实场景提供一体化解决方案,包括智慧场馆、景区、文博馆、游乐场所、大型商超、机场交通枢纽等等。
SenseMARS还融合了商汤领先的AI技术,具备专业级高精度三维数字化地图构建、跨平台和终端的空间感知计算、全场域厘米级的端云协同定位等空间定位和构建能力。SenseMARS还可根据对人脸和人体的检测,生成专属3D Avatar虚拟形象,并可实现真人驱动。3D Avatar可以灵活应用在视频、直播、虚拟观众席、游戏、在线教育等多种场景中。
SenseMARS可以适配各种终端,但你不要认为它只能支持那些通常出现在高端评测里的概念型设备,相反,它甚至可以支持小程序和浏览器连接。换句话说,你用现在的设备就可以链接进入商汤为你设定的元宇宙。
但是,真正帮助我们实现元宇宙的不仅仅是SenseMARS,还有SenseCore商汤AI大装置,它是我们通往元宇宙时代的过程中,物理世界数字化的操作引擎。
在从第一台PC发明到现在的数十年里,我们经历了信息化、数字化1.0和数字化2.0,如果要给这个过程找到一条线索的话,那就是逐步用数字构造一个数字化世界的过程。
而最大的区别在于,这个过程是渐进的。徐立用一张20年前用数码相机拍摄的照片为例,他说,当初拍摄的时候很激动,但后来发现这只是最初级的数字化——只是实现了图像的数字化,但“不能再做些什么”。
而我们“需要做些什么”才算元宇宙的初步实现呢?徐立认为,标准之一就是,对于这个世界(虚拟世界)的访问、搜索、操作能够直接影响到真实物理世界。而这样的数字化世界的建立通常需要几个步骤:
第一步,场景的数据化,也就是我们熟悉的像素化、3D化。但是数据如果没有和真实业务流程结合,单纯数据化作用有限。
第二步,要素的结构化,就是把数据化得到的大量数据,根据感知理解来抽取对于人类有意义的元要素,我们可以简单的理解为,把这些数据微服务化,变成可以操作、构建、编辑未来元宇宙地基的“乐高积木”。
然后才是第三步,也就是一切流程的可交互化,在这个过程中,机器智能和人工智能,以及前两者和真正的人脑所产生的智能,可以充分交互,这是构架一个有商业价值的数字世界的最后一步。
这些都实现后,我们可能会看到很多变化,比如汽车碰撞试验的车座上不再是假人、而是数字虚拟人;比如人们可以通过脑筋接口登陆新世界;比如我们在一生中可以体会更多的人生角色……
不要以为这些过程还只是写在PPT上的构想,无论是基于大装置的SenseFoundry商汤方舟城市开放平台、SenseFoundry Enterprise商汤方舟企业开放平台,还是惊艳现场的SenseAuto AR-Robobus(商汤绝影自动驾驶AR小巴),都已经成为现实。可以说,有了商汤AI大装置,我们距离元宇宙就真的不那么遥远了。
要想理解为什么AI大装置对于元宇宙的构建有非常具体的意义,我们需要一个来自真实生活的切入口。
比如,商汤绝影自动驾驶AR小巴车内,所有玻璃都改装了增强现实的屏幕,可以把车外内容实时投射到屏幕上,让乘客有一种处在不同次元世界的感受,这是感官上的,事实上它可以连接到任何被数字化的场景中,可以是观看水族馆也可能是发射导弹的控制室,当然更大的可能性,是叠加城市产业发展、经济规划、科技文化场景等视觉内容,整台车就变成了现实中的演示场。
从自动驾驶的实际层面,商汤绝影自动驾驶AR小巴在WAIC大会场馆附近做了巡回演示,车上采用雷达+视觉感知的双路冗余方案,能够更安全地完全自动驾驶。
那这个切入点折射了什么呢?「子弹财经」认为从商业价值的角度,至少提供了4种商业化的可能性。
最明显的两个路径,一是绝影量产智能驾驶,二是绝影智能车舱。而据「子弹财经」了解,商汤的智能车载业务已经属于国内头部,特别是基于视觉的方案,不断培养了全栈系统的能力,也从汽车行业里面引进了大批的人才,包括产品、交付、质量管理、供应链等等,逐渐形成了ADAS、智能车舱、智能网联等多个业务板块,合作的国内外车厂超过30家、定点的车辆超过2000万台,这意味着每天都将产生大量的数据。
另外,在我们所说的车路协同方面,商汤建立了路云连接感知的平台,这个平台会去汇集云端、车端、路端的感知数据,在此基础上挖掘数据里面潜在的价值,用于洞察个人消费、城市管理、企业服务等方方面面的场景需求。
但这一切还有一个更高层次的统一,就是赋能。
最近,发生过好几次传统车商和智能驾驶技术提供商的“言论交锋”,实际反映了汽车行业的一种心态——即主机厂、供应商也希望具备一定的AI研发能力,特别是结合自身硬件特点的应用研发能力,而这种能力,主机厂不具备、也不需要自己从头来过,原因就是有商汤这样愿意开放能力的生态。
当然,在开放能力甚至商业化这些能力之前,商汤首先要把AI训练到足够成熟,这就又回到我们最初的话题——大装置的价值。
比如,我们大致都知道AI的起点是模型,而且现在超大训练规模的通用模型训练正成为一个趋势,但是,实际到具体行业,却很少有行业能单独具备这样的能力。比如,现在一个大模型的参数可以达到百亿级,这就需要进行超大规模的分布式训练和算法优化,而商汤的能力到今年年底可以达到300亿(参数)的量级,在业内处于绝对领先的位置。
而且,由于超大模型的训练一旦成功,就可以延伸到各种业务场景中的小模型的优化,这样,只要商汤通过生态不断连接更多的伙伴,数据不断增加,就会产生一个“数据产生-数据应用-模型建设-模型优化-优化后再利用”的商业闭环,做到真正的服务于“千行百业、崇山峻岭”。
所以,AI大装置的建立,只是一个开始,是一个新的研发体系的开始,它越贴近实际、越为各行各业“奉献”,得到的回报也就越丰富,更新迭代的速度也就会更快,而这是商汤、乃至整个中国AI产业成为世界AI创新策源地的一次真正的起跑,未来,并不遥远。
「子弹财经」还想赘述一句的是,商汤作为一家创业公司,能够去打造大科学装置,不仅说明了商汤在基础研发上投入的决心,也说明了商汤对于当下一个主流认知的认可,这个认知就是“单纯的商业模式创新已经接近枯竭,新的机会来自于技术创新和模式创新的叠加”。
从这个角度来说,民营大装置有更明确的商业化靶标,有更直接的服务于具体经济领域的动力,有更接地气也更低门槛的产品逻辑。
我们有理由相信,商汤大装置的出现不仅是中国AI发展史上会写下的一笔,也是中国智能经济发展的一个里程碑。
*文中配图来自:摄图网,基于VRF协议。