车上设备人机语音接口

时间:2013-02-04来源:网络
6 语音命令处理策略

语音接口中最重要也是最难处理的是语音命令的识别部分。在车辆环境下,识别方法必须对车辆运行中可能的噪声和车内的回音具有鲁棒性,并且要有足够高的识别准确率和具有响应的实时性。为了实现这些目标,这个系统中,在语音信号输入通道中引入了噪声抵消和回音抵消技术;在语音识别算法中采用多步分层策略,使每一步的有效待识别词汇集尽量小,以提高每一步识别的准确度和提高识别速度。

在语音识别中另外一个问题是对说话人口音语速等方面的适应。由于汽车具有特定人使用的特点,也就是一般有一个特定的人使用这个汽车,所以这个语音识别过程采用特定人语音识别技术,而且RSC364支持特定人语音识别,并具有很高的识别率。它可由使用者直接训练语音识别系统,形成词汇的模板可以大大提高系统对这个使用者的语音识别准确度。

在汽车一定的状态下,和当前输入的命令状态下,下一步输入的可能的有效命令构成这个命令的一个合法后续命令集,依次类推,语音命令之间构成一个树型结构,称为命令树。在正确识别一个命令后,其后续输入的语音识别只在已识别命令的孩子节点集中进行。根据归纳的情况,一个命令的有效后续命令不超过20 个。在这样的词汇集中进行识别,可以达到很高的识别率,而且识别速度很快。

命令树有三层。第一层的可能命令集为:

Top={“复位”,“退出”,“状态”,“故障”,“关闭”,“电话”,“CD”,“车窗”,“空调”,“导航”,“启动提示”,“关闭提示”,“信箱” }

其中有后续(下层)命令的命令有 “电话”,“CD”,“车窗”,“空调”,“导航”, “信箱”表示要打电话的“电话”命令的后续命令有:

Tel-1={“拨号”,“挂机”,“重拨”}

其中,“拨号”的后续命令集为:

Tel-2={“0”, “1”, “2”, “3”, “4”, “5”, “6”, “7”, “8”, “9”, “通话”}。

表示播放C1D 的命令 “CD” 的后续命令集为:

CD-1={“播放”,“关机”,“增大”,“降低”}

车窗控制命令 “车窗”的后续命令集为:

Win-1={“左前”,“左后”,“右前”,“右后”}

表示选择要操作的车窗。其中每一个命令都对应有以下后续命令集:

Win-2={“升”,“降”,“停”}

表示要进行空调操作的“空调”命令有以下后续操作:

AC-1={“启动”,“关闭”,“提高”,“降低”}

在每一种命令的操作过程中都可以通过“复位”命令终止这个过程,而回到初始化时的状态。

每一个命令集在RSC364 中都用一个单独的词汇模板,以便进行训练。

7 结束语

本文介绍的系统可以作为一个统一的车上人机语音接口。与其它方式比较具有以下特点:

(1) 成本和价格完全处于车上应用能够接受的范围;单片机(嵌入式系统)能够满足其对计算能力和存储量的要求。
(2) 采用噪声和回声抵消等技术,使其完全能够满足车上环境的应用要求,可以达到用户接受的准确率。
(3) 通过网络与被访问设备连接,结构灵活、连接线路简单、适应性强。

基于语音的车上设备人机界面被认为是最自然、最安全、也最有发展潜力的人机交互方式。本文介绍的工作,目前还处于研究开发初级阶段,要应用于实车还有很多工作;而且,涉及到车上其它设备的连接问题。但是,这里给出的技术方法已经勾画出了一个完整的体系结构,进一步的工作可以在其基础上细化完成。汽车电子装置的网络化连接已经是一个必然的趋势,在这些装置具备网络连接接口时,本系统的连入就是一个非常自然和简单的事情了。虽然从目前的情况看,语音接口方式还不能推广应用,但它是一项必然要采用的技术方法。超前的研究开发工作对提高我国汽车电子技术水平具有实际意义。

参考文献
1 Charles J. Murray. “Automakers struggle with speech recognition technology,” EE Times Dec 1, 2000
2 Deborah F.Allinger. Charles Strauss and Dennis Kwon. “ Applications of speech technology to unmanned vehicles,” 20th Digital Avionics Systems Conference, Volume: 1, 2001. Page(s): 5B4/1 -5B4/9
3 T. Kuhn, A.Jameel, M.Stumpfle and A. Haddadi, “Hybrid in-car speech recognition for mobile multimedia application.” IEEE 49th Vehicular Technology Conference, Volume: 3 , 1999. Page(s): 2009~2013
4 Lawrence Rabiner, B-H Juang. “Fundamentals of Speech Recognition”. 北京:清华大学出版社,1999(end)
1 2 3

关键词: 接口技术 车上网络 语音识别与合成

加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW

或用微信扫描左侧二维码

相关文章

查看电脑版