一、机器翻译现在能做什么
针对我们当前机器翻译的发展状况,我们可用以下的案例来说明。5年连续用机器翻译同一个句子,通过结果对比,我们可以从流畅度、准确度等方面看出,机器译文翻译质量是在不断提高的。
这也有赖于近几年机器翻译的发展——2016-2017年,谷歌翻译上线神经网络机器翻译,此后各机器翻译企业也跟进了这方面的研发,译文流畅度得到大幅提升;特别是在2018年,微软公司宣布在新闻翻译系统特定领域,其质量超过人工翻译,可以窥见机器翻译近几年突飞猛进的现状。
同时,我们也可以开出机器翻译应用场景也大大拓宽,大体上可以分为开放翻译系统、私有系统、机器翻译与场景的融合。其中,私有翻译系统是一个较明确的商业化方向,根据用户数据实现定制化,无需联网,满足了不少B端和G端用户需求。
国内外也出现了较多出色的机器翻译公司,视频翻译也成为了一个热潮,字幕通、网易见外、Videolocalize和人人译视界等平台逐渐发挥出优势;各种新闻资讯翻译平台也得到了大众的认可;另外,电商翻译、跨语言搜索、跨语言大数据分析蓬勃发展,网络小说出海,翻译APP、翻译机/翻译耳机、AI同传等产品逐渐受到大众欢迎。
二、机器翻译还不能做什么
虽说机器翻译发展很迅猛,但当前机器翻译的发展还是具有局限性的,主要有漏译、上下文不一致等现象,在技术层面则存在大部分语言数据稀疏、神经网络可解释性差,融合语言知识难度大,缺乏客观评价标准等问题。具体而言,在技术层面,也面临着一些瓶颈,大部分语言数据稀疏,除中英外,其他语种的语料十分稀缺,比如东南亚语种;另一方面,神经网络可解释性还不够高,还是一个黑盒子;机器翻译在当前融合语言知识的“性价比”还不高;机器翻译缺乏客观评价标准,计算机语言没有绝对的量化指标衡量译文的好坏,不可能做到计算机完全取代人工翻译。
机器翻译什么时候像人工翻译一样好?李总用了两个图形象地说明:机器翻译在进行文字转换的过程中,会丢失大量的文化、常识、背景等信息,这是机器翻译短期无法像人工翻译一样好的重要原因。