语音识别 前景无限
取自 自然语言处理百科
语音识别(automatic speech recognition , asr)技术诞生30年以来,一直处于波澜不惊的平稳发展状态。但是近两年,语音识别技术领域巨浪迭起,取得了长足的发展。根据idg的统计数据,语音识别应用软件连续几年在全球范围内取得60%的增长率,而同期的销售额也达到了25%的平均增幅;此外,据市场调查报告,美国未来四年内, 以语音识别产品替代个人电脑键盘的市场年增长率,将达50%, 市场总值从4210万美元增加到 3.14亿美元。这两组数据充分说明,语音识别技术及市场正在飞速发展。使语音识别技术和市场迅速发展的源动力是多方面的,其中既有当今技术发展的因素,也有应用和市场的因素,还有未来的前景预测带来的牵动因素。
过去15年,计算机计算能力的发展是使语音识别技术得到飞速发展的重要技术因素。客户端平台逐渐获得了支持语音应用算法的能力,许多语音输入、语音控制技术在低端平台得到应用,这促进了市场对语音识别技术的兴趣。分析家称, 高速处理器和低成本内存的发展,将使语音识别成为下一代操作系统和应用程序的用户界面。
语音识别 应用广阔
随着网络的爆炸性扩张,电子商务获得了迅速发展,面向电子商务的语音识别技术将接踵而至,从电子邮件客户软件、到各种浏览器,都具备或者将要具备某种形式的语音识别功能,同时在网上会议的激烈讨论中,语音识别技术将发挥重大作用;在商业应用领域,基于电话的语音识别技术已推广应用到客户服务领域,在财会、广告、数据挖掘、信息管理以及出版等多个方面,语音识别技术也正由于其能够提供的种种便利条件而日益得到青睐,同时因为其密集文件和专用字汇的市场特性, 据预测,医学市场未来将成为语音识别产品的最大用户;在其他方面,语音技术正在为教育、培训等带来方便,用户在使用图形式交互界面时的适应时间也因语音的介入而大大缩短。
众厂商 潜心耕耘
面对如此广阔的应用领域,日前国内外多个公司正积极推动语音识别技术的应用:
在1997年秋季comdex 展览会上,语音识别系统和文本至语音的转换系统已是最引人注目的技术之一。microsoft宣布与 lernout & hauspie speech products公司建立联盟,共同加速实施语音识别技术在操作系统上的实现。bill gates 在勾画it事业的发展宏图时,首先提出下一代操作系统和应用程序的用户界面将是语音识别。展会上,microsoft与合作伙伴联袂推出了语音识别产品 voiceexpress, 将原语音指令和控制程序与连续语音识别技术结合在一起。
ibm公司潜心研究语音识别技术达27年之久, 投资超过2亿美元, 并于1997年9月4日在北京推出中文连续语音识别产品viavoice。lotus公司最近将smartsuite 97与 viavoice相捆绑, viavoice与suite的字处理软件wordpro 97相集成。
英特尔公司1998年致力推行语音识别技术,在北京举办了首届语音技术国际论坛,并在北京、上海、成都、广州展开“基于英特尔构架语音识别技术”宣传活动。英特尔公司更与中国科学院自动化所、清华大学、香港科技大学、香港中文大学、麻省理工学院、俄勒岗研究院、加拿大的waterloo大学七家世界著名学术机构成立“国际语音技术研究组织”,致力于计算机语音技术的基础研究,以加速汉语语音识别技术的发展,其对语音识别技术的重视程度可见一斑。
目前,国内也有多个厂商在自己的产品中成功运用语音识别技术:北京汉王科技公司宣布汉王笔与viavoice捆绑销售, 并开发出汉王手写输入系统 ; 北大方正文友系统在集成了方正文字处理软件、手写输入法 、方正飞扬电子邮件和字库的同时, 加入了语音输入功能;北京瑞驰安公司的瑞驰安dutty++计算机语音识别系统在保证windows 95原有功能完全不受影响的前提下, 通过语音识别这一全新的技术, 实现了windows 95和windows nt下的全面命令控制和全程听写输入功能。
在教育软件领域,语音识别技术也得到了成功运用,深圳市多媒体技术有限公司率先在其新近推出的教育软件 —— 《快快乐乐学数学》之《大营救》中引入语音识别技术。该软件以游戏、学习相结合的形式让学生对小学数学进行一次全面的总复习,在所有的操作过程中,用户均可以语音进行控制,这使软件的使用质量得以提高,小用户们可以摆脱繁琐的计算机使用培训,很轻易地运用软件提供的各种功能进行游戏和学习,从而大大提高了学生们的学习兴趣。
可以预见,在不久的将来,随着语音识别技术的不断应用,语音识别技术产品市场将会出现繁荣景象,语音识别技术——风光无限好。

