2021年07月02日
评论数(0)
近日,百度大脑联合新华社客户端推出的“一叶红船见百年”AR互动广获好评,从红船3D模型到船舱内部景致再到虚拟数字人,凭借耳目一新的交互体验、趣味横生的设计让AR互动,既弘扬了红色正能量,也让百度的AI技术引起了人们的兴趣。
六大黑科技
打造跨越百年的红色视听体验
“一叶红船见百年”AR互动可看可听可互动,堪称一场跨越百年的红色视听体验,而它的成功离不开百度大脑六大领先AI科技的鼎力支持。
本次AR互动最大的亮点莫过于贯穿全程的AR场景。
这些场景由百度DuMix AR空间感知、图像识别触发和互动渲染等三项科技联手打造。比如基于空间感知技术,本次红船AR互动运用自主研发的SLAM能力,通过对手机摄像头当前捕捉的实景进行实时地图构建和跟踪,成功将红船3D模型在实景中呈现。
比如通过图像识别触发技术,经由本地及云端的相同图检索功能,识图触发相应的AR内容,令用户可以更便捷地开启AR体验,并在交互中了解更多党史知识。
再比如基于互动渲染技术,AR互动运用天空盒全景图特效,让用户能够以全景方式观察红船舱内景致,极大提升了体验感。而互动渲染技术还支持大规模场景渲染与实时物理特效,赋予红船“乘风破浪”、“穿越时空”等特殊视觉效果,为用户打造了身临其境般的美妙体验。
虚拟数字人“小悟”则是本次AR互动的另一大亮点。
活灵活现、栩栩如生的“小悟”,拥有百度大脑两大关键技术的加持:
一是TTS在线语音合成技术。它负责将计算机自己产生的,或外部输入的文字信息转变为可以听得懂的、流利的口语输出。该技术基于百度领先的深度神经网络技术,采用端到端的建模方式与先进的异构计算,提供高度拟人、流畅自然的语音合成服务,特别是根据场景需求灵活设置语速、音调、音量,让“小悟”开口说话更有个性更加逼真。
二是DuMix AR虚拟形象生成及互动技术。它实现了虚拟形象的智能化生成,并且可以精准驱动虚拟形象的人脸表情,大幅降低了3D建模成本,让“小悟”说话时拥有流畅自然、惟妙惟肖的口型和面部表情。
与此同时,本次AR互动还复原了一些珍贵的党史资料图片,让历史栩栩如生地呈现在用户面前,令人印象深刻。这就让另一项黑科技——PaddleGAN中的影像修复技术走到台前。
该生成对抗网络开发套件源自百度大脑领先的深度学习平台“飞桨”,内置20+高性能前沿GAN算法,发布30+预训练模型,覆盖影像修复、图像生成、动作迁移、风格迁移等产业及互娱领域热门应用。
中国AI
厚积薄发、一朝惊艳、国之重器
“一叶红船见百年”AR互动背后,AI科技早已积累下大量落地成果。
譬如2018年百度DuMix AR SDK开放能力曾帮助可口可乐打造了轰动一时的“城市罐”营销活动,有效提升了品牌好感度。用户通过百度APP的AR功能扫描城市罐产品,进而解锁数十座城市的酷炫全景图与动画彩蛋。
在线语音合成与拟主播语音动画合成两大技术,曾联手帮助中国气象局华风集团,以岳云鹏形象为蓝本打造了国内首个明星 IP 虚拟主播,高度还原了岳云鹏标志性的形象、声线与风趣幽默,为全国3240个地区的用户带来生动有趣又精准的天气预报。
在今年父亲节期间,一位开发者运用飞桨生成对抗网络开发套件PaddleGAN所提供的脸部动作迁移及视频超分技术动态复原了爷爷的老照片,弥补了父亲错过爷爷最后一面的遗憾,引发老人泪崩,一时登上微博热搜。
而在更广维度上,百度大脑人工智能技术在各个领域的应用正在瓜熟蒂落。
以产业界为例,百度智能云工业互联网已覆盖钢铁、3C、水务、电力、汽车等14大行业,为100多家客户带来针对50多类工业生产核心场景的AI服务应用,助推中国智造。不仅如此,百度大脑陆续推出智慧金融、智慧医疗、智慧教育、智能客服等解决方案,进行业务创新,优化交互体验,实现提质增效。
在社会生活方面,百度城市大脑陆续落地北京海淀、云南丽江等地,助力政府部门提升公共安全、应急管理、智慧交通、政务服务等方面的管理能力。百度还打造了全球最大的自动驾驶开放平台和生态——Apollo,成为中国首个开放运营无人驾驶Robotaxi的公司,在长沙、沧州、北京三地全面开放规模化、常态化运营,已为21万人次提供出行服务。
作为第四次工业革命的核心驱动力量,AI技术早已成为国家之间激烈争夺的科技制高点。百度是国内投入最早、技术最强、布局最完整的人工智能领军企业,目前已经深度融入社会发展的方方面面,驱动智能化创新升级,成为新时代中国新基建的重要力量之一。
有理由相信,未来百度将代表“中国AI”继续勇立潮头,发挥“头雁”带动效应,助力我国赢得全球科技竞争主动权,把握产业变革的时代机遇。