机器翻译的八大挑战

取自 自然语言处理百科

跳转到: 导航, 搜索

  偶然读到EuroMatrix项目联络人Hans Uszkopeit教授(德国萨尔兰大学计算语言学教授,德国人工智能研究中心(DFKI)主任及DFKI语言技术实验室首席研究员)09年一月份的一个报告,上面提到机器翻译八个主要研究挑战(Main Research Challenges),觉得很有启发性,这里引述如下:

  ✩ 混合翻译方法(hybrid translation methods);

  ✩ 现有语言资源的开发利用(exploitation of existing linguistic resources);

  ✩ 在机器翻译(MT)中利用Web2.0方法(utilization of Web 2.0 approaches for MT);

  ✩ 在翻译中引入语义技术(bringing semantics into translation);

  ✩ 实践驱动的评测标准(practice-driven evaluation standards);

  ✩ 寻找和使用其他数据(find and utilize additional data);

  ✩ “自信”和“自我批判”的机器翻译(self-confident and self-critical MT);

  ✩ 在“语言智能”工作流程中嵌入机器翻译(embedding MT in language-smart workflows);

  这里,我只对第一点做个补充说明,其他几个方面大家可以探讨一下。Hans Uszkopeit教授提到目前从欧洲语料库基础上的机器翻译评测结果来看:基于统计的系统(SMT)在翻译结果上往往能有较好的词汇选择(lexical choice),但是经常选择错误的语法结构和得不到完整的译文;而基于规则的系统(RBMT)很难解决歧义问题及选择合适的词汇和短语,但是却能得到在语法结构、词汇顺序上比较完整的译文。因此,结合这二者优点的系统应该是一个比较好的研究方向。

  关于当前机器翻译所面临的挑战,我觉得一个很不错的话题,大家可以在这里各抒己见,为今后的研究提供一个好的思路。

注:原创文章,转载请注明出处“我爱自然语言处理”:www.52nlp.cn

本文链接地址: http://www.52nlp.cn/the-eight-major-challenges-of-machine-translation/

个人工具
工具箱