2023年04月12日
评论数(0)来源/天下网商
撰文/黄天然
编辑/李丹超
生成式AI改变千行百业的时刻,比我们想象中来得更快。
继4月7日“阿里版ChatGPT”通义千问开启邀测之后,4月11日阿里云北京峰会上,又有了新的重磅发布——通义千问不仅支持语言对话模式,还将在未来与阿里巴巴所有产品打通,用新的AI能力为各项应用赋能。
就如微软将ChatGPT加入Office全家桶作为AI助理、设计软件Adobe内置AI工具Firefly……峰会上,阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇也提出了将生成式AI的能力集成到阿里应用程序的设想。
“面向AI时代,所有产品都值得用大模型重新升级。”张勇说。当淘宝、钉钉、天猫精灵等都接入“通义千问”大模型进行全面改造,生成式AI将覆盖我们生活中衣食住行、工作及娱乐几乎所有消费场景,这样的未来图景已离我们不再遥远。
值得注意的是,这是3月底阿里宣布“1+6+N”组织结构“大变阵”后,张勇以阿里云CEO亮相的首次重要演讲。对于阿里云未来战略定位,张勇强调了“让算力更普惠”和“让AI更普及”,他表示,AI大模型的出现是一个划时代的里程碑,人类将进入到一个全新的智能化时代,就像工业革命一样,大模型将会被各行各业广泛应用,带来生产力的巨大提升,并深刻改变我们的生活方式。
阿里全部产品All in“通义千问”
4月7日,“阿里版ChatGPT”——通义千问,开启邀测时就吸引了业界极大的关注。阿里巴巴达摩院曾这样解释这款大语言模型的命名:“千问,千万次的问,千万的学问,能问出千问的一定是真爱,能回答千问的,也一定是真有学问,以及,AI和我们一样,都有千万次交互的热情。”
《天下网商》实测通义千问,它开启测试的功能主要为纯文本对话功能,正如它在“百宝袋”中所显示多种能力,不仅会按照主题撰写短文、电影脚本,还会编程写代码、做SWOT分析,甚至连“生成彩虹屁、写情书”等也可以“轻松拿捏”。
《天下网商》考验了几道与古典汉语相关的内容生成题目,通义千问的回答对比ChatGPT4并不逊色,在简单的情感识别、推理逻辑方面,通义千问也均表现出色。但对于一些具有干扰项“陷阱题”,与许多当下已问世的大模型一样,通义千问的回答目前还不能做到百分百完全正确。
通义千问与ChatGPT4内容生成能力对比
在会后的群访中,阿里云智能首席技术官(CTO)周靖人坦言:“目前ChatGPT-4确实是最为领先的大模型应用,我觉得这是科技进步的一个必然阶段,大家你追我赶,我们需要取长补短,我希望在下一个阶段,千问也能够贡献自己的一系列技术创新。”
在这次阿里云峰会上,可以看到通义千问创新的决心。据悉,不同于邀测版的文本对话功能,此次在大会上发布的通义千问,将具备多轮对话、文案创作、逻辑推理、多模态理解和多语言支持能力。这意味着,未来将有更多模态的信息融入到目前的大模型中,千问也将生长出具备更多有价值的功能。
不仅如此,阿里还为通义千问的落地按下了“加速键”,这一大模型未来还将接入到钉钉、天猫精灵乃至全部阿里应用。阿里巴巴将通过全面拥抱生成式AI,来驱动这一场技术变革。
这将会带来什么?以大会上发布的钉钉Demo为例,接入了通义千问之后,使用者相当于拥有了一个智能秘书,在会议场景,钉钉通过可以自动生成会议摘要,繁杂的群消息、聊天记录也能“一键总结”,团队outing计划书和宣传语也可实现秒生成,甚至连个性化应用都可以通过它快速搭建。
钉钉视频会议生成摘要
而当通义千问接入天猫精灵,它的回答能力和知识储备也将大幅提升,如果应用在儿童教育场景,小朋友不仅拥有一个十万个为什么都能问到的“AI老师”,还可以与之聊天谈心、玩游戏。
在淘宝天猫等电商应用场景中,通义千问则可以成为一位购物顾问,按照个性化的需求为用户做购买推荐,还可以提供庆祝家人生日、安排家庭派对的活动方案;在旅行应用飞猪中,千问则可以成为旅行者的AI私人旅游路线规划顾问……
可以想象,当阿里所有产品未来接入大模型全面升级之后,各式各样的生活场景都可能迎来AI对于原本应用方式的颠覆与变革,而这些新的能力将陆续到我们身边。
“通义千问”背后的支撑力
通义千问的诞生,来自阿里多年的技术积累。
周靖人表示,并非是因为ChatGPT的问世才做了通义千问,而是在AI大模型研究方面一直坚持着自己的技术路线。
阿里在ChatGPT热潮兴起之前的2019年,就已布局了大模型研究。作为国内最早进入大模型研究的公司之一,阿里云从2020年初开始同时研发多模态大模型和语言大模型。2021年达摩院连续发布语言大模型Plug(后更名为 AliceMind)和多模态大模型M6。2022年9月,两个大模型合并为“阿里通义大模型”。
“其实今天只是我们在探索大模型领域的一个节点,它既不是起点也不是终点,而是一个中间节点,我们的最终目标是让多模态真正趋近‘人类智慧体’。”周靖人说,“这次发布的最大价值之一,是能通过将大模型接入阿里应用这一方式,将其潜力发挥出来。我觉得它的潜力是巨大的,有一系列让人无限遐想的概念场景。”
而大模型快速研发生长的背后,是算力、算法、大数据等诸多底层能力的竞争,这需要超大规模的AI基础设施作为支撑。尤其是算力基础,堪称大模型之间比拼的“杀手锏”。CNET有分析报道称,对于生成式AI的大模型而言,在每一次看似简单的提问和响应背后,都需进行数十亿次的计算做为支撑,运行成本庞大,这比普通网络应用程序或者页面服务所需的算力要高得多。彭博社曾有报道,为向ChatGPT的研发公司OpenAI提供算力支持,微软在3年前专门打造了一台由数万个英伟达A100 GPU组成的大型AI超级计算机服务器,成本高达数亿美元。
对此,阿里云也做了准备。在峰会上,张勇表示,十多年来,阿里云已经累积了从飞天云操作系统、芯片到智算平台的“AI+云计算”的全栈技术实力,并在Iaas(基础设施即服务)和Paas(平台即服务)的基础上,建立了第三层Maas(模型即服务)的体系,这意味着,阿里云不仅将为自身的大模型通义千问建立好庞大的技术底座,还将把更多的算力基础与大模型能力开放给更多企业与社会。
在未来,阿里云将核心做好两件事情:第一,让算力更普惠,推动自研技术和规模化经营的正循环,持续释放技术红利;第二,让AI更普及,让每家企业的产品都能接入大模型升级改造,并有能力打造自己的专属大模型。
“我们希望在阿里云上训练一个模型的成本,能够降低到现在的十分之一,甚至是百分之一。即使是中小企业,也能通过云平台获得AI大模型的能力和服务。”张勇说。
“通义大模型”的下一步
回顾阿里云的发展历程,过去十年阿里云自研核心技术,全面服务数字化进程。从2009年最初的飞天第一行代码的诞生,抗住一场双11的流量洪峰,到如今成为数智时代的基础设施,为千行百业赋能,走出了一条依靠硬核技术不断成长的路径。
而今,智能AI时代来临,阿里通义大模型从阿里生态出发,面向千行百业。
周靖人介绍,未来每一个企业在阿里云上既可以调用通义千问的全部能力,也可以结合企业自己的行业知识和应用场景,训练自己的企业大模型。比如,每个企业都可以有自己的智能客服、智能导购、智能语音助手、文案助手、AI设计师、自动驾驶模型等。
发布会当天,阿里云宣布就将与OPPO安第斯智能云联合打造OPPO大模型基础设施,基于通义千问完成大模型的持续学习、精调及前端提示工程。同时,中兴通讯、吉利汽车、智己汽车、奇瑞新能源、毫末智行、太古可口可乐、波司登、掌阅科技等多家企业表示,将与阿里云在大模型相关场景展开技术合作的探索和共创。
除了开放自研的通义千问大模型外,阿里云也在积极建设开源的AI社区生态。
去年11月,阿里云正式提出“Model as a Service”理念,并推出国内首个AI模型社区“魔搭”,开发者可以在魔搭上下载各类开源AI模型,并直接调用阿里云的算力和一站式的AI大模型训练及推理平台。发布不到半年,“魔搭”社区总用户量已超100万,模型总下载量超1600万次,成为国内规模最大的AI模型社区。
面对如今大模型通用性与易用性仍欠缺的难题,通义想要打造通用模型+定制化服务的解决方案打造的AI统一底座,对于站在AI智能化时代门口流连张望的人来说,或许是一种高性价比的解决方案。