科大讯飞翻译准确吗？AI翻译取代同传？

搜狐网中国企业家
2019-08-13 14:44:57

来源：站酷海洛

AI翻译要想超越人类，就必须达到美剧《西部世界》里的强人工智能水平，否则机器翻译仍将长期扮演辅助者的角色。

文 | 《中国企业家》记者张弘

编辑 |徐昙

近日，一篇关于“科大讯飞AI同传造假”的爆料帖将科大讯飞推上了舆论的风口浪尖。

9月20日，一位自称在现场的同声传译员爆料称，科大讯飞在近日举办的一次会议上采用的“智能翻译”并非采用AI翻译，而是机器识别同传说出的译文后，再将译文投放到屏幕和直播中，直播中播出语音合成的人声。

该同传译员还称，科大讯飞事前并未告知他和搭档会场有语音识别的字幕，也没有告诉他们直播的同传是机器朗读二人翻译文稿，没有征得二人同意就冒名使用了他们的翻译成果，有侵犯知识产权的嫌疑。

这给外界造成一种“所有的成果都是AI翻译”的错觉，而忽略了同传译员们的背后付出。很快，同传的圈子议论纷纷，有人认为这样的做法在很大程度上剽窃了同传译员的工作成果。 “实际上，这种做法可以理解成机器只是发挥了一种作为速记和录入的功能。”一位不愿具名的人士称。

9月21日，科大讯飞回应称，没有提到AI同传，并没有造假吹牛，目前的情况是一个误会，“科大讯飞从来没有把同传翻译包装成机器翻译。”

9月26日，科大讯飞在其微信公众号发布一篇《真金不怕火炼，科大讯飞没有造假》的文章再次澄清，科大讯飞没有造假，从未“隐瞒”转写同传声音，“人机耦合”不仅是技术发展的趋势，更是社会伦理发展的要求，公司将用法律武器维护公司声誉。

文章进一步解释称，在为期两天的会议过程中，科大讯飞一直按照既定方案进行会议支持，上会的是“讯飞听见”，而非“机器翻译”。发帖的同声传译在现场看到两张屏幕，一张显示演讲者演讲的英文文字，一张显示同声传译的中文文字，但这并不代表科大讯飞只有“转写功能”，没有“机器翻译”功能。

据刘庆峰介绍，目前AI翻译包括全自动机器翻译和人机耦合同传两种模式。在9月17日举办的2018人工智能大会上，现场十余位嘉宾的发言只有三位用了人机协作转写同传老师语音的方式，其余均采取全自动机器翻译。

科大讯飞相关工作人员告诉《中国企业家》，此次风波让很多人误解科大讯飞只有转写，没有翻译技术，而科大讯飞的翻译技术在国际上处于领先地位。

科大讯飞董事长刘庆峰在不同场合曾表示，人机协同、人工智能+行业，才是未来人工智能最有希望做成的。

Rokid AI实验室负责人高鹏博士告诉《中国企业家》，以目前的语音技术水平而言，在日常场景下使用AI翻译没有多大问题，但在一些严谨的政治、学术会议等场合，并不能完全实现AI同传，机器只是一种辅助。所谓“人机辅助”，在某种程度上可以减少一些人工重复性的工作，但整体而言，目前的AI翻译并未解决核心的技术问题。

AI翻译取代同传？

AI翻译是否会取代同传?随着AI的火爆、机器翻译技术的进步，这个问题一直备受同传行业关注。

“起初，担忧被机器抢了饭碗，还有点抵触，后来觉得还是顺应时代的发展，未来是属于人工智能的。” 一位从事同传8年的人士告诉《中国企业家》。

也有同传人士对此表示不足为惧，“AI并不会对我们构成什么威胁，我们有自己的专业壁垒。” 另一位同传人士告诉《中国企业家》。

不可否认，在一些涉及政治、技术、学术等会议场合，依然需要专业的同传人员。“我们不仅要翻译字面本身的意思，有时还要传达出演讲者本身的意图、态度和立场，但机器目前却无法实现。” 上述同传人士称。

以目前的AI发展水平来看，AI翻译广泛应用于一些非专业场景比如日常翻译、交流，准确率相对较高，“已经有了大量的样本存在。但在一些对于容错率极低的政治、学术等专业领域的翻译则比较困难，翻译的准确率并不够高，很难达到专业场景的要求”。高博说。

科大讯飞曾表示这些问题的存在，恰恰是他们探索“人机耦合”道路的另一个原因：让机器成为同传的助手，提升同传工作效率和准确度。

但目前技术层面的突破依然存在很大难度。据高博介绍，目前AI语音翻译涉及三种技术：语音识别、机器翻译、语音合成转写。目前较难的两项技术突破在于语音识别和机器翻译。

目前AI翻译的原理，一般是先通过语音识别将发言人的声音转写成文字，再通过机器翻译得到目标语言的文字，最后通过语音合成获得目标语言的声音。

近几年，谷歌、微软、IBM、百度、科大讯飞等都成立了机器翻译团队从事相关研究，设法打破语言障碍。

据了解，目前机器翻译的主流方式叫“统计翻译”，基本原理是从语料库大量的翻译实例中自动学习翻译知识，然后利用这些翻译知识自动翻译其他句子。比如为了让机器顺利实现中英文之间的翻译，首先需要收集大量中英文双语句对，然后使用计算机从这些双语句对中统计并学习翻译知识。

但对于一个优秀的机器翻译系统而言，对于词的翻译知识、短语的翻译知识、语法结构的翻译知识、语义的翻译知识等等全部都要掌握。“现阶段很难说AI翻译取代了人工同传，业内使用人工同传是非常普遍的现象。”高博说。

业内人士认为，虽然现在可以通过一些实用的技术让机器去模拟人的智能活动，模拟人对语义的理解。但相对于彻底的人工智能和语义理解，还有相当长的一段路要走。

科大讯飞董秘、高级副总裁江涛表示，尽管机器翻译获得发展，明年能达到英语专业8级的水平，但依然没办法代替同传。“如果有一天机器真的能够实现准确的实时翻译，它们的角色更可能是辅助相关产业的工作人员更轻松、便捷地开展工作，而不是取代他们。”

AI技术尚不完美

一方面，要让机器不断地学习翻译知识，另一方面，目前的语音识别技术的发展也面临着很大的瓶颈。

据了解，由于语音识别技术的很多难题仍处于实验室研究和学术界讨论阶段，尚未完全投入到产品和具体的场景应用中，“还没达到真正可以使用的水平”，高博说。

当前正处于弱AI阶段，“目前语音识别的准确率较高，理想状态下虽然可以高达98%。但仍存在口音、距离、干扰、混响等方面的问题，这些并非短期内能够解决的。”

高博介绍，在语音识别这一环节本身存在一些识别错误，机器通过语音识别这一环节后，仍会存在错误。“加上翻译本身也存在准确率问题，在翻译过程中可能会在原有的错误的基础上增加5%-10%的错误。”

2017年，刘庆峰表示，现阶段人工智能技术发展不需要“被神化”，虽然目前机器翻译在衣食住行等常用生活用语上的中英翻译可达到大学六级的水平，能够帮助人们在一些场景处理语言交流的问题，但“距离会议同传以及高水平翻译所讲究的‘信、达、雅’还存在很大的差距。”

此前，多位AI行业人士告诉《中国企业家》，弱AI阶段的语音识别技术还不够完美，存在诸多瓶颈。京东叮咚音箱科学家汤跃忠在接受本刊采访时称，目前语音识别、语音合成、自然语言理解、降噪、唤醒等技术仅仅达到可用的程度，尚未达到令交互的用户十分满意的阶段。而前期研发投入时间和精力最多的就是语音识别、唤醒率、声音合成等核心技术。

人类语言是非常复杂的体系，与人类独有的思维模式密切相关，如果科技发展不能在模拟人类思维模式方面实现质的飞跃，那么也就无法在机器翻译领域超越人类。

看来，AI翻译要想超越人类，就必须达到美剧《西部世界》里的强人工智能水平，否则机器翻译仍将长期扮演着辅助者的角色。

关键词：科大讯飞翻译准确

分享到: