2023年07月25日
评论数(0)出品 | 创业最前线
作者 | 晓光
编辑 | 方芳
美编 | 邱添
审核 | 颂文
2023过半,但大模型的热度丝毫未减。不久前在“AI届的春晚”WAIC2023大会上,大模型当之无愧成为了顶流。
人们如此关注大模型,是因为大模型的本质是加速了AGI时代(通用人工智能时代)的到来,之前AI领域被局限的商业化空间,变得十分广阔。虽然大模型商业化才刚刚开始半年,但是已经很快地融入教育、医疗、制造、办公、律师、游戏、艺术等多个领域,渗透程度和渗透效率都是前所未有的。
在今年的沃斯世界经济论坛上,微软的CEO萨蒂亚这样形容大模型带来的AGI时代——我一生中从未见过,美国西海岸的先进科技可以在几个月内,以非常真实的方式出现在印度农村,对于知识型工作者来说,也许这一次完全等于工业革命。
不过大模型从入局到真正落地并推向市场,难度不小,资金、人才、基础设施、场景及商业化落地等,成为每个玩家都要跨过的“障碍赛”。
所以在国内掀起“百模大战”的时刻,我们也需要回答,什么样的大模型才能称得上智能生产力?各行各业行业未来需要怎样的大模型和服务?
为了回答这个问题,商汤在几个月前提出了“商汤日日新SenseNova”大模型体系,并且在不久前的WAIC2023大会上,又释放出了该体系及体系下的产品全方位升级更新的信息。
对于大模型服务于人类,商汤的第一重思考是——把底座做牢固。因为大模型的形成并不复杂,它是“大数据+大算力+强算法”结合的产物。
为了让大模型的底座更牢固,商汤一直在通过“大模型+大装置”持续推动AI基础设施能力的跃进提升,公开资料显示,商汤历时多年建设了业界领先的AI大算力,其拥有超过2万7千块GPU芯片卡,可输出5000P的总算力,是亚洲目前最大的智能计算平台之一。
基于大装置的能力,商汤目前已构建了计算机视觉、自然语言处理、AI内容生成、多模态、决策智能等多个领域的大模型,而且大装置也成为了商汤降低AI模型的生产成本、让大模型深入百业的根本。
站在“大模型+大装置”的AGI战略布局上,商汤日日新SenseNova大模型体系,正在实现着飞速升级。
有业内人士对「界面新闻·创业最前线」表示,在大模型的基础上,具备知识图谱、能对行业知识和数据进行提炼的小模型,在专业领域中的能力一定会超过大模型,这就让商汤大模型的“体系化”更有意义。
我们也可以这样理解,“日日新SenseNova”体系,是AGI“涌现效应”的外在表现,就像人到了18岁之后突然有了能力和心智上的突破一样。现在,“日日新SenseNova”大模型体系在智能座舱、交通、金融、医疗、电商等方面,都有了低门槛、低成本、高效率的创新应用和突破。
(图 / 日日新大模型目前落地的应用场景)
有位一级市场的投资人甚至这样对「界面新闻·创业最前线」表示——企业当然可以选择不接轨大模型,毕竟谋局落子、各有千秋,但未来打败你的也不是大模型,而是有着AI大模型加持的对手。
需要强调的是,商汤的“日日新”是一个大模型“体系”,商汤内部对它的定位,是提供一个大模型的超市,在这个“日日新”大模型超市里面,有数据、模型训练以及部署的三位一体的飞轮,以此来作为上下游合作的基础。
并且大模型超市也可提供自然语言、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力,同时结合决策智能大模型,为AGI实现提供重要起点。
目前,“日日新SenseNova”体系包含了中文语言大模型“商量”,作为千亿级参数的自然语言处理模型,商汤商量SenseChat 2.0版本突破了大语言模型输入长度的限制,并推出不同参数量级的模型版本,可完美适配移动端、云端等不同终端及场景的应用需求;还有文生图生成模型“秒画”、AI数字人视频生成平台“如影”、3D背景建筑生成平台“琼宇”和3D物体生成平台“格物”等等。
(图 / SenseChat 2.0的技术升级)
具体到应用上,之前许多大模型都是通才,但它缺乏行业深度,之前大家被GPT震惊的时候,认为它什么都会,但如果你是一个行业的资深用户,你会发现通用大模型在安全、金融、语音这些垂直领域还不是全才。
目前商汤发布的这几个大模型,都在各自的领域里称得上是“行业专家”。有位券商的计算机行业研究员对「界面新闻·创业最前线」说,他对日日新大模型体系中人(AI数字人)-物(3D物体生成)-场(3D背景建筑生成)的搭建印象很深。
负责3D物体生成的格物2.0版本,现在支持了多种物品品类的复刻,达到毫米级别,特别是格物还解决了传统的重建技术中,对高反光、镜面物体的采集和复刻这一行业难题。珠宝首饰,小家电,金属物件都能被格物“复原”出来,不仅可以避免伤害和改变物品的情况,还能精确还原物品的外观和特征。
如果一家博物馆,想对几万件动物标本进行3D化处理,依赖激光重建技术还原一个标本就要千把块钱,这项投入高达数千万元,没财力的博物馆根本不能去做,而今格物2.0可以完成效果更好的重建,还可以把成本打到很低。
再例如,格物还包含一键成图和一键成片等再创作服务,通过一键成图功能,用户可以生成与物品使用场景相融合的海报,或者试穿试戴的真人海报,相比其他AI技术只能部分还原商品细节,一键成图可以100%还原物品的各个视角和效果。
(图 / 格物现阶段的能力)
基于此,该研究员预判道,商汤的大模型体系在技术上,可以为电商带来“通用”的颠覆性解法。
在格物的加持下,许多商家不用再去自研商品的上身效果呈现,就能对一件商品各个视角和效果重塑,提升客户的沉浸体验;直播间的实景搭建也不用再耗费太多的真金白银,基于3D内容生成平台琼宇,不仅有身临其境的背景,而且搭建效率、渲染效率也能大幅提升;另外,直播间的“人海战术”也不用太频繁,因为通过如影的数字人搭载商量的语言能力,“硅基生命”也可以进行完备的介绍。
公开资料显示,日日新大模型体系下的商量、琼宇、格物、如影都在各自的赛道上创造了不小的技术突破,现在已经与一批头部厂商开始了合作。
基于日日新大模型体系,不仅可以对现实生活中的“人、物、场”进行全面构建,融合不同垂直领域的专业知识,还能构建更懂行业、更具专长的交叉行业大模型,从根本上降低大模型的下游应用成本和门槛,也使得商汤的收入更加多元化,提升抗风险能力大大增强。
商汤智慧生活等新兴业务收入增长加速,且占比大幅提高,多元化的收入结构标志着商汤的业绩成长或步入上升通道,同时也印证了商汤一直坚持投入大模型、赋能百业战略的前瞻性。
对于商汤来说,其定位一直是ToB的企业,B端的大模型需求,更多的考虑AI的“泛化能力”,泛化能力通俗来讲就是指学习到的模型对未知数据的预测能力。
许多企业客户知道自己要什么,他们会对大模型的应用给出一个“轮廓”,但是需要商汤用泛化能力,去稳定的预测、迭代,并一步步逼近真实的痛点。
所以,应用场景成为检验大模型能力的关键,特别是不同行业还给出了商汤“跨场景”的考验。
以商汤打造的车路云协同的交通体系为例,商汤凭借多模态、多任务通用大模型,开发了路侧视觉感知大模型,又结合琼宇2.0及格物2.0构建了一个智能交通孪生与仿真系统,再利用商量2.0的感知推理和人机交互能力,实现了车路云共同向大模型对话式交互的演进。
我们看到的交通场景应用是,在车舱外,商汤可以展开端云协同;在车舱内,打造了一个更懂用户的“车舱大脑”,带来集安全、娱乐、教育及效率于一体的智能座舱体验。
(图 / 在汽车行业的“跨场景”应用)
与此同时,商汤日日新大模型体系还积累了大量的场景优势与场景经验,这对于通用型技术的开发也有巨大的助推作用。
在医疗行业,商汤由于有着大装置的超大算力和医疗基础模型群的坚实基础,商汤能够化身“医疗大模型工厂”,基于特定需求,帮助医疗下游的临床长尾问题高效训练模型,满足着不同医疗机构个性化、多样化的临床诊疗需求。
公开资料显示,商汤已经与行业伙伴合作推出医疗语言大模型、医疗影像大模型、生信大模型等多种垂类基础模型群,覆盖CT、超声、内镜、病理、医学文本等不同医疗数据模态。
在具体应用上,商汤为郑州大学第一附属医院打造影像、病理、心电三大智能远程诊断平台,借助大模型辅助地区特色病、疑难病的诊疗,有效推动医疗长尾问题的解决。
另外,基于海量药学知识和专家经验,郑大一附院还与商汤合作研发了行业前沿的用药咨询语言大模型,将为患者提供更智慧便捷高效的线上用药咨询服务和体验,再次实现了大模型从医到药的“长尾渗透”。
这些解决方案,现在已落地全国多家头部三甲医院,商汤正在用跨场景、跨行业的AI技术,助力医院在诊疗、科研、决策等各个层面,实现智慧化转型升级。
所以在B端,商汤的能力不是模型,也不是模型群,而是扩大自己在行业中的大模型工厂,对企业客户的痛点解决得更精准。一旦企业客户习惯于商汤带来的大模型后,客户较高的转换成本也会为商汤形成较深的护城河。
接下来的大模型军备赛,或许不再是局限于大模型训练的追逐,也不是问AGI到底能颠覆什么产业,因为不同的产业应用场景已成为大模型的最佳“练兵场”。把不同的赛道整合进一个体系里,构建起产业生态,才会把价值链做到足够长,这时候,我们要问:“AGI究竟不能颠覆什么?”
*注:文中题图来自摄图网,基于VRF协议。