刘群:计算所与北大往事回顾一
取自 自然语言处理百科
编者注:这个系列是我无意间看到的,觉得刘群老师的成功与他坚持自己的选择和对研究方向的把握能力有很大关系,写得也很好,就放在这里了!
- 序
这篇文章,本来是为计算所建所50周年写的一篇稿子,标题是“计算所往事回顾”,发表在计算所网站建所50周年的专栏上。因为我这些年来的工作与北大计算语言所有密不可分的联系,我在写初稿的时候,花了很大篇幅介绍我跟北大计算语言所合作的情况。初稿写成后,我请了很多人帮我看,包括北大计算语言所的俞老师、詹卫东、常宝宝等人,他们看到我对以前的这些事情的回忆都很感慨,也给了我很多的鼓励。后来在计算所网站上正式发表时,考虑到这篇稿子毕竟是为计算所建所50周年而写的,我与北大合作的这些事情与这个主题关联不大,所以就忍痛删掉了很多这方面的文字,另外也删掉了一些比较具体的技术细节。现在征得俞老师同意,把这篇稿子的全文发表在“燕园时语”上,补上了被删除的部分,标题改成“计算所与北大往事回顾”。不过原来文章是以我在计算所的经历为主线来写的,这一点没有改动。谨以此文献给这十几年来跟我一起在自然语言处理和机器翻译领域并肩战斗过的老师、同学和朋友们。借用詹卫东给我的邮件中的一句话:衷心祝愿我们这些一起战斗过的NLPers一切顺利。
- 引言
计算所宣传外联办的祁威跟我约稿,要我为计算所建所50周年专刊写篇稿子,回忆一下我所经历的一些事情。她的来信引起了我对往事的一些回忆。我是1989年进入计算所的硕士研究生,毕业后一直留所工作至今。比起计算所的老同志来说,我在所里的时间并不算太长。不过在现在的计算所,放眼望去,到处都是生气勃勃的年轻人,与计算所的绝大部分人比起来,我也确实应该算得上是“老”员工了。不算在研究生院(玉泉路)学习的一年时间,我在计算所已经工作了整整16个年头。虽然我只是计算所一个普通研究人员,计算所这些年来发生的一些重大事件,我们并不处在这些事件的中心,但对于我们具体的每个人来说,还有很多的小事,同样值得我们去回味。也许正是这些小事,可以从一个侧面,佐证我们计算所这些年来辉煌而又曲折的发展历史吧。
- 在二室
先说说我自己的经历吧。
攻读硕士学位
我是1989年作为免试推荐的硕士生进入计算所的。当时报的导师是高庆狮院士(当时还叫学部委员)。进所的时候,因为高院士出国未回,我的导师改成了张祥研究员,也就是当时计算所二室的主任。在玉泉路学习的一年很快就过去了,回到所里的时候,我和师妹韩向阳都被分到了陈肇雄博士领导的机器翻译课题组,师弟潘伟被分到了蒋贤春负责的汉字识别课题组。
我刚到计算所二室的时候,张祥老师还是863专家组的组长,那时二室还是非常红火的。1990年我们刚从玉泉路回所的时候,赶上在京西宾馆举行EST863工作站的鉴定会,规模非常大。
接下来的两年,我开始在陈肇雄课题组研究机器翻译,这个课题组承担了863的“智能型机器翻译”项目,课题经费是74万元人民币。当时参加这个项目的,除了计算所的人以外,还有很多合作单位,包括北京科技大学、中国科技情报所、珠海科健公司、北京工业大学等等,研究开发工作进行得非常红火。这段时间的工作,使我对计算语言学和机器翻译的研究发生了极大的兴趣。在我以后的经历中,虽然换过好几个地方,但我的研究工作一直集中在这个领域,没有离开过。
1992年,我顺利完成硕士学习和硕士论文(我的论文主要是做其中的知识库管理系统),获得了硕士学位。也就在这个时期,机器翻译课题组的工作取得了重大的进展。课题组和香港权智公司签署了协议,权智公司投入74万美元,课题组投入机器翻译技术,双方共同合作成立了“科智”公司,将系统植入权智公司的“快译通”产品之中。由于权智公司的产品早已行销全世界,产品的销路完全不成问题,而这又是全世界第一个带有全文翻译功能的电子辞典产品,这是一次非常好的合作,引起了轰动。从此以后,陈肇雄的事业开始走上了快车道,先是于1993年和1995 年分别获得中科院科技进步一等奖和国家科技进步一等奖,而后又在1997年离开计算所,成立了华建公司。华建的机器翻译产品也一直是市场上最好的机器翻译产品之一,这是后话了。
也就在我们毕业的时候,陈肇雄脱离了计算所二室,成立了计算所机器翻译中心。我的师妹韩向阳跟陈肇雄去了机器翻译中心,师弟潘伟去了美国,而我则选择留在了二室。
转自:http://mtgroup.ict.ac.cn/~liuqun/research/experience.htm#_Toc146986889

