番外篇:机器翻译漫谈一
取自 自然语言处理百科
据圣经记载,创世纪伊始人类原本居住在一起,语言也一致,闲来无事便打算建造通天之塔,打破天地之间的隔绝,上帝对此十分恐惧,于是他混乱人类的语言,分散人类的分布,最终没有让通天塔建成。这个故事包含一个隐喻,就是说整个人类如果能够联合起来,就会拥有通天的力量。当然了,前提是要先解决两个主要障碍:地理因素和语言问题。时至今日,自巴别塔之乱已千百年过去,受科学进步和产业革命所推动,电话、无线电、铁路、喷气分机、互联网等交通通讯工具纷纷出现,地理上的隔阂已不再构成不同国家或民族之间的鸿沟。取而代之的,则是人们彼此沟通所用的语言。
一直以来,跨语言交流绝对是一项极耗资源的大事,一般都是在国家的资助和庇护下进行,比如西方古希腊文学的翻译和《圣经》的翻译,以及中国东汉至唐宋的佛经翻译、明末清初的科技翻译和鸦片战争至“五四”的西学翻译,都离不开托莱多(巴格达的"翻译院”)、译经阁、同文馆,、墨海书馆和广学会等机构或组织。因为耗资源,所以国家主导的翻译主要集中于外交、科技、政治、宗教等领域,内容也多仅限于少量精选典籍。近代以来,随着经济全球化时代的到来,不同语言的人们交往不断增多,各国在经济和社会生活中的交流日益广泛,公司的产品要销售到世界各地,各种技术文档需要翻译为本地语言,各种国际组织和政府间的文件也需要用多种语言书写。同时,互联网的迅猛发展带来信息的大爆炸,这些信息涉及人们工作和生活的各个方面,如何让这些信息为不同语言的人群所用?显然,单靠人工翻译已无法胜任,机器翻译才是唯一的希望。
很早以前,人们就萌发了利用机器进行翻译的梦想。古希腊时代,人们试图设计一种理想化的语言叫自然语。17世纪,笛卡尔和莱布尼兹试图在统一的数字代码基础上编写字典,提出用机器词典来克服语言障碍的设想。17世纪中叶展开的“普遍语言”的运动,旨在运用逻辑原则和图形符号的基础上,创造出一种无歧义的语言。其中最著名的成果便是维尔金斯提出的中介语,其设计试图将世界上所有的概念和试题加以分类和编码,有规律地列出并描述所有的概念和实体,并根据它们各自的特点和性质,给予不同的记号和名称。二十世纪初,德国学者里格提出了一种数字语法,这种语法加上词典的辅助,可以利用机器将一种语言翻译成多种语言。但是,以上努力都只停留在设想阶段,仅限于概念和构想的提出,并未真正实现最简单的机器翻译功能。严格意义上,机器翻译的开端应该自20 世纪 30 年代初法国科学家 G•B•阿尔楚尼“机械脑”的实现。
20 世纪 30 年代初,法国工程师阿尔楚尼提出用机器进行语言翻译的想法,并在1933年7月22日获得 “机械脑”专利。这台机器的存储装置可以容纳数千个字元,通过键盘后面的宽纸带,进行资料的检索。至此,机器翻译的实践研究真正开始。20 世纪 50 年代初,随着计算机技术的成熟,英国工程师布斯和美国工程师韦弗提出利用计算机进行语言自动翻译。在学术界的积极倡导和企业的大力支持下,机器翻译研究一时兴起。1954年,美国乔治敦大学在IBM公司的协同下,进行了世界上第一次机器翻译试验,接着,苏联、英国、日本也进行了机器翻译试验。但是,早期的机器翻译只把机器翻译看成一种机械的解读密码的过程,而没有没有意识到机器翻译在词法分析、句法分析以及语义分析等方面的复杂性。由于对自然语言认识水平低,机器翻译的质量很差,1966年,美国国立科学院自动语言处理咨询委员会发表了一份“臭名昭著”的ALPAC报告,称经过调查,机器翻译速度慢,准确率差,比人工翻译费用高得多,在近期或可以预见的未来,开发出实用的机器翻译系统是没有指望的。在此报告的影响下,各国纷纷停止或削减机器翻译研究投入,第一次机器翻译研究高潮结束。之后从60 年代中期到 80 年代初,计算语言学和人工智能获得了长足进步,人们在利用计算机处理自然语言方面有了很大进步。作为智能信息处理的一个重要领域,机器翻译重新受到各国的重视。许多发达国家相继投入了巨额资金研究和开发机器翻译,形成机器翻译的第二次高潮。欧共体的 EURORA 计划和 DLT 系统,日本的 Mu 系统和 ODA 计划,以及美国 SYSTRAN 的机器翻译研究等,都是这个时期著名的机器翻译研究项目。在重视语言知识的表示机制的同时,人们开始着手机器翻译策略的研究。除了传统的基于规则的翻译方法,基于实例的机器翻译、基于统计的机器翻译等新的机器翻译方法不断涌现。但到 90 年代初,第二次机器翻译研究高潮又一次因翻译效果不如人意而跌入低谷。
转自:http://fane.cn/forum_view.asp?forum_id=39&view_id=42987
编者注:这是一篇佚名的机器翻译漫谈文章,与董老内行的角度不同,从内容和出处来看,这应是机器翻译门外汉的作品,刚好可以做个比较阅读。

