董振东:机器翻译漫谈一

取自 自然语言处理百科

跳转到: 导航, 搜索

  机器翻译(machine translation),又称机译(MT),是利用计算机把一种自然语言转变成另一种自然语言的过程。用以完成这一过程的软件叫做机器翻译系统。

  世界上许多国家长期以来都一直在从事这项研究。事实上自本世纪40年代电子计算机诞生之日起就开始了将计算机应用于语言翻译的探索。我国机器翻译的研究可以追溯到50年代中期。今年是我国第一次机器翻译试验成功演示的40周年。40年前的那次试验虽然规模不大,但是在当时已经是世界水平了。当时世界上能进行这样试验的国家实在是屈指可数。半个世纪以来,世界范围和我国的机译研究都曾走过一段曲折的道路,都有过60年代中期以后约10年的停滞或沉寂,不过原因不尽相同。国外主要是受了美国曾专门组织的一个机构于1966年发表的机译界无人不晓的ALPAC报告的影响,纷纷停止了对机器翻译研究的经费支持。ALPAC报告主要说的是:经过调查,机器翻译速度慢,准确率差,比人工翻译费用高得多,在近期或可以预见的未来,开发出实用的机器翻译系统是没有指望的。这个报告后来虽曾受到许多严肃的批评,认为它是带有严重偏见的,但它还是对机器翻译研究造成了很大的损害。直到70年代中期机器翻译才开始在世界范围内复苏并日趋走向兴旺。日本却是极少数未受世界范围的停滞影响的国家。80年代初日本几乎所有的大计算机公司都进行机器翻译系统的研究和开发,如富士通、日立、日本电气、东芝、夏普等。日本在推动机器翻译研究方面的贡献为世界所公认。在它的倡导下,于1987年在日本箱根举行了第一届机器翻译峰会(MT Summit),并决定以后每两年轮流在亚、欧、美定期举行。不久又相继成立了亚太机器翻译协会,欧洲机器翻译协会,北美机器翻译协会,以及国际机器翻译协会,还定期出版了《机器翻译通讯》。今年九月在新加坡举行了第七届峰会,它也是本世纪的最后一次峰会,其主题是"迎接新世纪翻译的机器翻译"。我国有代表应邀在"世界各地机译进展"的主题研讨会上介绍了我国的机器翻译研究和开发的现状,还有代表应邀参加了经费投资的主题研讨会并介绍了我国各种渠道对机器翻译研究的投资状况。笔者应邀在会前的学术研讨会上做了题为《英汉/汉英机器翻译的过去、现在和未来》的报告。

  如今机器翻译对于许多人来说应该已经不是很陌生的的词儿了。今天我们可以在软件商店买到形形色色的PC机译软件,各种语言对的,如英文到中文的,中文到英文的,或者日文到中文的,甚至也有英文到日文的等等,还有什么家庭版的,专业版的,配带各种不同专业词典可供选择的等等。据估计,世界上目前市场上有 1000多种不同的机器翻译软件在销售,我国具有一定规模的PC机器翻译软件也有近20种。在世界范围内PC机译软件的价格都不贵,而且价格还在不断地下降。现在我们甚至可以在网上免费享用翻译系统的服务。因此现在用户已有较大的选择余地。当然一个用户在选择机译系统时,应该首先很好地弄清自己的需求。具体来说,我们有如下的建议。

  第一,如果你的翻译任务是较稳定的或长期的,专业单一的,翻译结果要达到出版水平的,你可能是一个翻译公司、或一个专业情报所,那么你可以选择配有大规模相应领域的专业词典的,并且又经得起大批量、长时间翻译运行的(有的系统会死机的)系统。同时更理想的是你还可以再配备一个"翻译记忆"系统,它可以帮助你处理文本格式问题(如字体、图表、脚注等),而且可以把你经过修改的正确译文保存起来供以后翻译时再利用。

  第二,如果你的翻译任务是临时性的,专业不单一,翻译质量要求无须达到出版水平的,那么你可以选择配有多个领域的专业词典的,但还是应经得起大批量、长时间翻译运行的系统。

  第三,如果你是为了浏览网上信息要用到翻译,那么你一定要选择可以在网上运行的系统。如果你的外语水平还可以但词汇量有限,那么还可以选择一种只有大规模词典但可随点随译的系统。


编者注:这是董振东老师的一篇文章,从文中内容来看,应发表于1999年,但这篇文章的真知灼见现在看来也仍有很大的参考价值。

个人工具
工具箱