2017年11月18日
评论数(0)
文 | 曾响铃
来源 | 科技向令说(xiangling0815)
2017年11月16日,由腾讯主办的2017腾讯媒体+峰会在上海召开。这是腾讯集团COO任宇昕第一次参加媒体峰会,“半年以前,我基本上是一个纯粹的媒体读者,在过去的半年时间之内,我基本上算是一个媒体的从业者。所以我正好可以分别从媒体读者和媒体从业者,这两个不同的角度,来分享一下,我对当前媒体行业变化的一些看法。”就在他分享半年心路历程的同时,腾讯微信智聆、腾讯翻译君以及机器人写作工具Dreamwriter三个AI产品向现场观众实时输出内容和报道,并推送了出去。
事实上,这不是AI第一次,也不是腾讯第一次在公开场合大秀同传写作绝技。一度在网络上也曾引发“AI要取代人工同声传译者和新闻记者”的讨论。支持者喜上眉梢,反对者大骂“哗众取宠”,那到底这事靠不靠谱,在和媒体从业者戚戚相关的同声传译和写作领域,AI要取代人工还得面对哪些坎儿?
比想象来得更快,腾讯AI们把同声传译、写作等事全干了
人类语言本身具有极大的复杂性和多样性,无论是同声传译还是写作,都是门技术活。半个多世纪以来,计算机系统对于人类语言的理解一直处于比较浅的层次,但偏偏在这个时候,AI大行其道,一副要替代的样子,而且比我们预期的要快得多。
就在这次“媒体新星球——2017腾讯媒体+峰会”上,腾讯新闻写作机器人DreamWriter现场写作了会议新闻稿,微信智聆和腾讯“翻译君”分别为此次大会提供语音识别速记和中英同声传译服务,将嘉宾演讲内容实时转化为中英文双语字幕呈现在大屏幕上。
据了解,腾讯翻译君所拥有的神经网络翻译技术和微信智聆领先的语音识别技术,它们配合进行的同声传译服务,之前在腾讯视频V视界大会和腾讯合作伙伴大会上也曾亮相。按照其官方介绍,腾讯翻译君在中英互译方面,已经达到业界领先水平。目前,翻译君支持中、英、日、韩、法、德、意、土等15种语言,超过80种语言对的翻译能力,除了文本翻译外,翻译君还支持语音,图片等多种翻译形式。
而微信智聆则是微信AI团队基于深度学习理论自研的语音识别技术,目前微信智聆也已扩展到多个应用场景,比如联合腾讯翻译君推出会场同传服务,联合腾讯云推出电话客服质检服务、音频关键字检索服务、英文口语发音评估服务和面向远场环境的智能硬件语音平台小微,为个人和企业用户提供语音识别服务。
当然,除了腾讯,Google、Facebook、微软、百度、搜狗、今日头条等技术巨头都已悉数进场,或在推进深度学习在机器翻译领域的研发和应用,或在写作领域让AI大展拳脚。2016年9月,Google发布谷歌神经机器翻译(GNMT: Google Neural Machine Translation)系统,声称该系统利用神经网络技术,模仿人脑的神经思考模式,可产出媲美人工翻译的高质量译文,并将误差降低了55%-85%。谷歌公司己经将该技术应用于网页翻译与手机应用,译文质量明显提升。
另外在写作领域,腾讯新闻写作机器人Dreamwriter、今日头条新闻机器人张小明(xiaomingbot)、新华社的“快笔小新”、百度“百度写作大脑”等都已墨粉登场。
这看起来是一场AI的狂欢,也成了机器技术挑衅人类的战书。
真要取代人工,AI先得回答这几个问题
正如腾讯集团COO任宇昕所说,“在技术维度上,我们也在思考是不是还可以用更多、更新的科技力量服务现在的媒体行业”,“未来很多的艺术创作AI都能完成,媒体行业的AI写作也不再是梦想,也许有一天技术将给我们带来全新的视角。”我们在憧憬AI给我们生产生活带来极大便利的同时,需要将技术和工作生活融合,不过更加需要强调的是“服务”。从这个点上看,AI到底会不会取代人工并不那么重要,AI到底能不能服务好人类才是最重要的。
从现在看,不管是在同声传译还是写作领域,AI都需要正视这些事情。
一、准确率到底有多高?
据搜狗方面称,其机器翻译准确率达90%,不过王小川那两次的现场演示,网络上引发了一波“伪科技”的质疑。因为据媒体报道,在乌镇世界互联网大会上,其翻译结果出现了语焉不详的“中式英语”,(还好可以勉强看懂)而在香港科技大学演示过程中,又出现了前后矛盾的现场BUG。
于是,AI翻译到底有多准成了疑问。
当然评价AI机器翻译内容质量的好坏,国际上也有一些方法,除了人工评测,也有多种自动评测方法有,其中,IBM的watson研究中心在02年提出的BLEU方法被业界较为广泛认可。参考《机器翻译及其评测技术简介》的说法,BLEU方法就是比较候选译文(candidate)与参考译文(reference)中相同的片段数量。其思想是用翻译结果中连续出现的N 元组( n 个单词/ 字或标点) 与参考译文中出 现的N 元组进行比较,计算完全匹配的N 元组的个数与翻译结果中N 元组的总个数的比例。然后,作者使用一个测试语料,让2个翻译专家和3个机器去翻译。,也就是它允许一个原文有多个参考译文。但请记住,这里没有一个准确率的绝对值。
同样,国内外目前对于机器翻译的准确率并没有一个准确的数值,不管是谷歌微软,还是百度有道金山等,他们基本都以“翻译错误降低率”来衡量自身技术的成熟度,而不是以具体准确率。
不过对于AI而言,如果要提高其准确率,首先得保证它你能“听得懂”和“听得清”。(这个后面细说)
二、这些技术已经被检验过了吗?
搜狗机器翻译之所以被嘲笑,另一个原因就是未经验证,就连其公开的实践,也闹出诸多笑话。
谷歌也曾出现过类似的“事故”,2006年其发布的基于短语的机器学习(PBMT)系统,因为该系统是将句子分解成词和短句,进行逐个翻译,从而忽略了上下文,造成译文质量不佳。
这其中最大的BUG是技术还未获得足够量级的测评,也就是技术的成熟度未经市场验证。比如有媒体就直言“从始至终,不知道你发现没有,搜狗实时机翻的用户只有王小川一人。”
在这方面,腾讯的做法就相对“踏实”一些,首先腾讯不公开宣扬自己有多高的准确率,其次,他们信奉的是“是骡子是马,拉出来溜溜”,让其AI产品在市场上到处跑,比如腾讯翻译君日翻译请求量超过2亿次,目前微信、QQ、VIPKID、金山词霸、QQ浏览器、QQ邮箱、大众点评等都已应用,这就覆盖了社交、邮箱、浏览器、点评等多个场景。而在用户侧,腾讯翻译君App已上线iOS、安卓各应用市场,普通用户可以直接使用其同声传译功能。微信小程序 “腾讯翻译君”,也能实现实时语音翻译和权威外语词典,即说即译。微信智聆则跑得更早,2013年就在微信、QQ、游戏、搜索等数十个产品中应用。
所以“光说不练假把式”,技术不能被钉在墙上当作菩萨拜,AI要真正取代人工,做同声传译、写作等人类高复杂的工作,就得先应用到实战中来。
三、机器缺失的情感因素怎么补?
语言是门艺术,是活的,是有起伏有感情的,只有放在一个大的语境下面才可能被完全准确理解。即便是同一句话,放在不同语境下表达的也是不同的感情色彩,对应的翻译也就不同。
也许,AI机器可以综合词汇句式甚至情境,但是机器能真正理解不同的情感吗?也许,AI机器能达到95%准确的翻译,但是那剩下5%的感情,又该如何表达出来呢?
因为就是这5%的情感,就可能造成一定的理解障碍甚至是误解。要知道目前人类的情感表达还没有算法可以将其转化出来。
而要让这些机器表达出这些情感因素,最基础的前提是AI需要提高语境理解能力。目前智能翻译对于中文复杂含义句式中的时态辨别能力还不够,往往需要充分理解整句话的意思才能准确把握时态。但智能翻译并非基于理解,而是基于统计学与语料库,只能做到将这句话意思大致翻译准确,所以在识别感情色彩方面,还需加强。
不过好消息是,将神经网络学习的抽象表示和传统符号语义方法结合,建立新的基于语义的机器翻译系统,或许可以大幅提高AI对组合语义、复杂的递归语言结构的处理能力。
四、特殊情况能特殊处理吗?
前面说,要提高AI翻译的准确率,需要保证它你能“听得懂”和“听得清”,这不仅要求AI能准确判断出被翻译对象(如演讲者)的语音、停顿,并在极短时间内进行“语音断句”,还需要在涉及一些模糊音时能够根据“上下文”进行及时调整,更棘手的是要让A能灵活处理一些特殊情况,比如口语。
之前自媒体“智能相对论”就撰文讨论过,要想解决机器翻译的问题,就得包容口语的“4个任性”,这包括:
1、日常口语具有不连贯的特性。如:重复、次序颠倒、冗余和语句残缺。
2、语法约束相对较弱。例如口语中存在大量的代词,人类口语比较容易理解,但AI不能结合上下文,如果缺乏背景知识,就难以区分指代对象,导致翻译结果偏离原意。
3、没有明确的句子边界。口语中没有标点符号来标志句子,也基本没有传统意义上的句子,缺少了必要的声调和停顿,很容易造成句子的歧义。
4、非正式语体材料多。中英口语中都存在较多随意性的口语或网络用语,且多为非正式的语体材料。
要应付这些复杂情况,AI需要大量补充口语化语料,并且需要改变直译方式,(目前智能翻译针对口语词汇与口语表达多采取直译),让机器翻译真正智能起来。
综上,没有具体量化的考核标准(或许本身也不需要),多数技术未被充分检验,缺乏临场应变的实力,机器缺乏人类情感表达等都是现实中的问题。当然令人欣慰的是,腾讯、谷歌们一直在为更好的体验努力,从2017腾讯媒体+峰会上的体验看,这些探索也产生了正向的效应。
任宇昕在2017腾讯媒体+峰会上表示,把媒体高峰论坛升级为腾讯媒体+峰会,目的在于通过更名能更好地顺应这个媒体变革的时代,希望与到会的前沿的媒体实践者和创新者从多个维度一起来描绘未来的媒体新星球,并带领所有人更好地完成这个面向未来的迁徙。
其实,不仅仅是腾讯,也不仅仅是媒体从业者,所有的人工智能应用和公司都应该正视人类和机器真正的差别,这不仅仅是一场技术谁优谁劣的较量,更是一场如何理解人和人的需求的对垒。
技术依然会继续进步,但我们希望人更加理解人。
(完)
曾响铃,作家、天使投资人、钛媒体等2016年度十大作者,钛媒体、虎嗅、i黑马、创业邦等近60家媒体专栏作者,《商界》《商界评论》《销售与市场》等多家杂志撰稿人。TMT新媒体“铃声”创始人。【移动互联网+ 新常态下的商业机会】、【趋势革命 重新定义未来四大商业机会】等畅销书作者。微信号:xiangling0815