人工智能翻译会取代人类翻译 机器翻译会取代人工翻译
核心提示:文章来源:赛先生微信公众号“熟读唐诗三百首,不会作诗也会吟” 。见识海量范文之后的机器真的可以通过“暴力学习”来取代人类的工作吗?实际上,优秀的译文应该具有灵活性和创造性,寄望于通过“大数据统计”路...
文章来源:赛先生微信公众号
“熟读唐诗三百首,不会作诗也会吟” 。见识海量范文之后的机器真的可以通过“暴力学习”来取代人类的工作吗?实际上,优秀的译文应该具有灵活性和创造性,寄望于通过“大数据统计”路线来推进机器翻译的想法是不能指望的,因为这种翻译过程不包括对语句内容及其所属的言语行为的理解,这一重大缺陷也不能通过对该技术的改进而克服 。
最近谷歌汉译英改用了神经网络技术 。做了测试的人们有两点共识,一是译文质量比以前的技术要好很多,二是离人的翻译水平还差得很远 。有趣的是,在此基础上专家们对机器翻译的前景却有截然相反的估计 。乐观主义者认为,照这个速度发展下去,机器早晚会接管所有翻译工作;悲观主义者则认为,根据机器翻译所暴露的缺陷可以看出,这个技术再怎么发展也有好多因素是没办法掌握的 。
这让我们想起了“半瓶水”既可以说成“半满”也可以说成“半空” 。一般说来,对于一个正在发展中的技术而言,两种说法都有道理:一方面,现存一些缺陷是会被该技术的进一步发展所弥补的;但另一方面,任何一个技术都有其根本局限,所以不是所有的问题都一定会在这个技术的框架中被解决 。要预测机器翻译的发展空间,必须具体分析现有技术对翻译过程的刻画 。
机器翻译的流派
参考资料[1]介绍了机器翻译领域及其中的主要技术流派 。翻译是人工智能研究中最早被考虑到的实际应用之一 。在人们发现计算机可以被用来对语言进行编码处理以后,很快就有人想到可以用它来进行翻译工作 。和人工智能的其它子领域相似,这里的故事也是跌宕起伏 。
在开始时,受当时语言学界主流(乔姆斯基理论)的影响,机器翻译主要走的是“基于规则”的路线 。简而言之,这就是为每种语言整理出一本“词典”和一本“语法书”,然后在两种语言之间建立词和句子的水平上的对应关系 。以英译中为例,这样一个翻译过程对每个英文句子进行下列处理:
(1)分析其语法结构以及其中每个词的角色(主语、谓语、宾语等等) 。在这个过程中,主要考虑词类(名词、动词、形容词等等),而不考虑每个词的意思 。
(2)分析其语义,即把句中英语词汇及其语法关系表示成独立于语言的概念关系 。
(3)把这些概念关系用汉语重新表达出来 。
在这些步骤中所遵循的规则都是语言学家所总结出来的 。尽管语言学家和人工智能工作者付出了巨大的努力,这条路径并没有导致预想的进展并达到实用水平 。这主要是因为人类的语言,即所谓“自然语言”,实在是太复杂了 。和人工构造的数学语言或计算机语言不同,自然语言的使用非常灵活,其结果是几乎所有语法规则均有例外,几乎所有的词汇都有多个意义,因而不同语言的语句或词汇之间也就不存在符合规则的对应关系 。
【人工智能翻译会取代人类翻译 机器翻译会取代人工翻译】部分地出于对“基于规则”的方案的失望,自然语言处理研究者们逐渐转向了“基于统计”的路线 。这个办法是把大量的实际出现的语句整理成“语料库”,然后用统计的办法来发现其中的某些规律性,比如说词与词之间的相继频率(如在“这”之后“是”出现的概率)或可替换性(如把语料库里句子中的“狗”换成“猫”后,有多少结果还在语料库中) 。以此来实现语句预测、补全、纠错等功能 。把统计方法用到机器翻译当中,就是用大量的已有翻译范文(比如联合国文件)为训练数据来生成一个翻译系统 。这种翻译技术直接在两个语言的词句之间建立对应关系,而在此过程当中不依赖于人工整理的语法规则和词典 。当然,这个办法要求的数据量和计算量都非常大,但这些现在已不是不可满足的 。
谷歌的神经网络翻译系统是统计方法的一种具体的实现方式 。下面这个出自谷歌网站的动图简单表示了这个系统将一个中文句子翻译成英语的过程 。首先,一个“编码网络”将逐字加长的输入字串表示成一系列数值向量 。然后一个“解码网络”依照这些向量逐词生成一个英语句子 。在解码过程中,系统对各个向量的“关注”程度是不同的,这就表现为两个网络节点之间的连线有浓有淡,而且随翻译的进展而改变 。
推荐阅读
- 慢性荨麻疹会有传染性吗
- 湿疹传染吗?
- 大三阳会传染吗
- 变性人会有 变性人能活几年
- 翻译|高考报志愿时要避开!北大教授预测,这三类职业或将在十年后消失
- 好茶需要珍藏,广州秋季茶博盛会今大福好茶同您分享
- 比亚迪|比亚迪腾势高端MPV实车内饰曝光:大屏不会转了?
- 会喝茶是明白人,四个时间点别喝茶会致命
- 太极拳练习错误会伤身体
- 怀孕喝茶叶水有影响吗,百香果加蜂蜜的孕妇能喝吗会有影响吗
