冯志伟:宗成庆《统计自然语言处理》一书序言四
取自 自然语言处理百科
基于统计的自然语言处理的理论基础是哲学中的经验主义,基于规则的自然语言处理的理论基础是哲学中的理性主义。这些问题,说到底,是关于如何处理经验主义和理性主义关系的问题。为了追本溯源,在这里,我愿意回顾一下哲学中经验主义与理性主义,并且考察一下它们对于语言学和自然语言处理的影响,这样,也许能够帮助我们更清楚地认识到这个问题的实质。
自从人类有哲学以来,在认识论中就产生了经验主义(empiricism)和理性主义(rationalism)这样两种不同的倾向。在欧洲哲学史上,当近代哲学家们把这两种倾向的冲突以及解决这一冲突的不懈努力提到全部哲学的中心地位上来之前,无数的哲学家们就已经对此进行了艰苦卓绝的研究,走过了崎岖漫长的探索道路。
人类哲学从它产生的第一天起,就在自身之内包含着一个深刻的矛盾:哲学来自经验,但它又是超越经验的结果;哲学是理性思维、范畴和概念的运动,但又只有经验才能推动它。感性与理性的这种矛盾实质上也就是经验主义和理性主义的矛盾,它作为存在和思维的矛盾在认识论方面的一个表现,自开始的时候起,就是人类哲学思想发展的内在动力之一。
这种矛盾,在人们的思想中都有不同程度、不同形式的表现,但是,经验主义和理性主义作为比较典型的认识论的理论,并且形成了两个既互相对立、互相斗争,又互相影响、互相渗透的哲学流派而在哲学史上出现,则是在西欧早期资产阶级反封建革命时期前后,成为16 世纪末期到18 世纪中期重要的历史现象。
在16 世纪到18 世纪的欧洲,经验主义哲学以培根(Francis Bacon, 1561-1626)、霍布斯(Thomas Hobbes, 1588-1679)、洛克(John Locke, 1632-1704)、休谟(David Hume,1711-1776)为代表,他们都是英国哲学家,因此,经验主义也被称为“英国经验主义”。培根批评理性派哲学家,他说,“理性派哲学家只是从经验中抓到一些既没有适当审定也没有经过仔细考察和衡量的普遍例证,而把其余的事情都交给了玄想和个人的机智活动”。他提出“三表法”,制定了经验归纳法,建立了归纳逻辑体系,对于经验自然科学起了理论指导作用。霍布斯认为归纳法不仅包含分析,而且也包含综合,分析得出的普遍原因只有通过综合才能成为研究对象的特殊原因。洛克把理性演绎隶属于经验归纳之下,对演绎法作了经验主义的理解,他认为,一切知识和推论的直接对象是一些个别、特殊的事物,我们获取知识的正确途径只能是从个别、特殊进展到一般,他说,“我们的知识是由特殊方面开始,逐渐才扩展到概括方面的。只是在后来,人心就采取了另一条相反的途径,它要尽力把它的知识形成概括的命题”。休谟运用实验推理的方法来剖析人性,试图建立一个精神哲学体系,他指出,“一切关于事实的推理,似乎都建立在因果关系上面,只要依照这种关系来推理,我们便能超出我们的记忆和感觉的见证以外”,他认为,“原因和结果的发现,是不能通过理性,只能通过经验的”,经验是我们关于因果关系的一切推论和结论的基础。
现代自然科学的代表人物牛顿(Isaac Newton, 1642-1727)建立了经典力学的基本定律即牛顿三定律和万有引力定律,使经典力学的科学体系臻于完善。他的哲学思想也带有明显的经验主义倾向。他认为自然哲学只能从经验事实出发去解释世界事物,因而经验归纳法是最好的论证方法。他说:“虽然用归纳法来从实验和观察中进行论证不能算是普遍的结论,但它是事物本性所许可的最好的论证方法,并随着归纳的愈为普遍,这种论证看来也愈有力”。他把经验归纳作为科学研究的一般方法论原理,认为,“实验科学只能从现象出发,并且只能用归纳来从这些现象中推演出一般的命题”。正是由于牛顿遵循经验归纳法,才在物理学上取得了划时代的伟大成就。
法国启蒙运动的代表人物伏尔泰(Voltaire,1694-1778)也有明显的经验主义倾向。他以洛克的经验主义为武器去反对教会至上的权威,否定神的启示和奇迹,否认灵魂不死。他赞美经验主义哲学家洛克:“也许从来没有一个人比洛克头脑更明智,更有条理,在逻辑上更为严谨”。他积极地把英国经验主义推行到法国,推动了法国的启蒙运动。
哲学中的这种经验主义深刻地影响到自然语言处理中基于统计的经验主义方法,它是自然语言处理中经验主义方法的哲学基础。
转自:宗成庆《统计自然语言处理》序言

