机器翻译(Machine Translation, MT)是计算语言学的一个分支,用于提高人工翻译的生产率和一致性,是人工智能的终极目标之一。机器翻译的学术思想建立在理性主义上,提倡对语言系统的整体理解。机器翻译最初采用 “词对词”的翻译方式,但人们很快意识到,机器翻译必须建立在对自然语言的整体理解上,包括语法、语义、语用等基础问题的研究。在借助于本体语言学完成对基础问题的理解后,人们开始了机器翻译的实验、研制、开发的过程。

机器翻译的研究历史可以追溯到二十世纪30年代。二十世纪30年代初,法国科学家阿尔楚尼(G.B. Artsouni) 首次提出用机器进行翻译的想法。1933年,苏联发明家特罗扬斯基(П.П. Troyansky)发明一款能够将一种语言翻译成另一种语言的机器,但限于当时技术落后,这款机器最终没有能够面世。1946 年,第一台现代电子计算机 ENIAC 诞生。1947年,信息论的先驱、美国科学家 W. Weaver 和英国工程师A. D. Booth提出了利用计算机进行语言自动翻译的想法。1949年,W. Weaver 发表《翻译备忘录》 ,正式提出机器翻译的思想。1954 年,美国乔治敦大学在 IBM 公司协同下,用 IBM-701计算机首次完成了英俄机器翻译试验,拉开了机器翻译研究的序幕。其后,机器翻译的设想和研究实践经历了从最初的设想到全盘否定的过程。

直到上个世纪的70年代,随着计算机硬件技术的大幅提高,以及自然语言处理中人工智能的应用,机器翻译研究迎来复苏。1976 年,欧洲委员会开始使用 Systran 系统翻译摘要。国外推出了 Weinder 系统、EURPOTRA 多国语翻译系统、TAUM-METEO系统等。我国则于80年代中期建设出 KY-1 和MT/EC863 两个英汉机译系统。其时,本地化行业继续呈快速增长势头,很多从事传统翻译行业的供应商开始提供翻译记忆工具,以实现译文的回收利用,并为翻译员提供术语工具。虽然这些翻译技术工具变得更具可扩展性,功能变得更成熟,但其提高生产力的核心技术在很大程度上没有变化。

大约在2000 年左右,全球经济活动的密集增加,促进了文档翻译需求的增长。在市场需求的推动下,机器翻译技术转到翻译软件的开发,译星、雅信、通译、华建等机器翻译软件走进市场,商用机器翻译系统迈入了实用化阶段。这一时期,用于翻译的技术和业务模式在发生整体变化,出现翻译网站,有专门的翻译软件网站,比如有道翻译、金山词霸、灵格斯翻译家等,也有百度、谷歌、微软、360和 Yandex等基于搜索引擎的翻译软件,翻译软件开发呈现出跨领域的特点。

现在,机器翻译已成为最具时效性的翻译方法之一,最为先进的是神经网络机器翻译软件,运用深度学习、神经网络等先进技术,在大数据翻译基础上,以句子为单位,对翻译过程进行建模;并且利用神经网络技术的递归性,基于前文内容,对后文内容进行预测和调整,实现语境意义的识别,提高译文质量。

但是,目前看来,机器翻译在技术领域虽表现较好,可以达到90%的正确率;但在经济和人文领域,表现却是差强人意。特别是有关文化方面的文章,机器翻译完全不能胜任。译后编是必须的,甚至比直接人工翻译更费力。机器翻译代替人工翻译的前景不明。 期待科学家们的曲径通幽,柳暗花明又一村。

机器翻译为什么有这样的发展历程(机器翻译的历史和现在)(1)

,