《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信與網(wǎng)絡(luò) > 業(yè)界動態(tài) > 實用的家電語音控制系統(tǒng)的設(shè)計

實用的家電語音控制系統(tǒng)的設(shè)計

2008-07-30
作者:戴海生1, 朱小燕2, 羅予頻1

  摘 要: 家電語音控制" title="家電語音控制">家電語音控制系統(tǒng)在復(fù)雜的背景環(huán)境下,由于識別率顯著下降而導(dǎo)致關(guān)鍵詞檢出率偏低。介紹了利用孤立詞、連接詞" title="連接詞">連接詞以及連續(xù)語音識別引擎" title="識別引擎">識別引擎構(gòu)造的多識別引擎的識別器,該識別器允許用戶自由選擇語音輸入方式,擴(kuò)大了關(guān)鍵詞的檢出范圍,從而達(dá)到提高關(guān)鍵詞檢出率的目的。同時給出了家電語音控制系統(tǒng)" title="控制系統(tǒng)">控制系統(tǒng)的整體結(jié)構(gòu),分析了影響系統(tǒng)性能的關(guān)鍵因素,并且給出了相應(yīng)的解決方案。
  關(guān)鍵詞: 語音識別" title="語音識別">語音識別 家電語音控制 語音確認(rèn) 關(guān)鍵詞檢出


  近年來,隨著語音識別與確認(rèn)技術(shù)的逐漸成熟,基于語音識別技術(shù)的對話控制系統(tǒng)受到了越來越多的關(guān)注。現(xiàn)有的語音技術(shù)雖然在實驗室環(huán)境中取得了較好的識別效果,但是一旦由于環(huán)境或者說話人的客觀原因使得語音信號變差時,就會導(dǎo)致系統(tǒng)檢出率急劇下降,從而使得語音控制系統(tǒng)的性能變差甚至不能正常工作。
  針對殘疾人行動不便的問題,在日本富士通公司的資助下開發(fā)了一套殘疾人利用語音進(jìn)行家電控制的系統(tǒng)。本系統(tǒng)的用戶主要是康復(fù)中心的特殊用戶,由于身體長期癱瘓或者其它原因,他們不僅行動不便,而且語言交流能力也有很大程度的下降,尤其是發(fā)音不夠清晰準(zhǔn)確,僅僅用傳統(tǒng)的語音識別器很難滿足控制系統(tǒng)實際應(yīng)用的需要。因此,提出了綜合利用孤立詞識別器、連接詞識別器以及連續(xù)語音識別器構(gòu)建一個基于多識別引擎的識別器的方法,使得關(guān)鍵詞被正確檢出的可能性大大增加,在允許用戶自由使用孤立或者連續(xù)語音交流的同時,還最大限度地利用不同識別引擎的優(yōu)點,改善了家電語音控制系統(tǒng)的性能。
  另外,還分析了語音控制系統(tǒng)中確認(rèn)、模型自適應(yīng)以及對話控制策略等關(guān)鍵技術(shù),并且給出了相應(yīng)的解決方案,從而給出了家電語音控制系統(tǒng)的完整結(jié)構(gòu),在電梯、輪椅、電視等設(shè)備的實際控制中取得了良好的效果。
1 家電語音控制系統(tǒng)的結(jié)構(gòu)
  家電語音控制系統(tǒng)包括軟件設(shè)計和硬件設(shè)計兩部分。本文主要討論軟件設(shè)計部分,其中包括:語音識別模塊、語音確認(rèn)模塊、對話控制及硬件指令傳輸模塊以及模型自適應(yīng)模塊。整個系統(tǒng)的流程是:首先,用戶的語音被送入語音識別模塊進(jìn)行Viterbi解碼識別,得到相應(yīng)的候選關(guān)鍵詞;然后,將候選關(guān)鍵詞送入語音確認(rèn)模塊進(jìn)行確認(rèn),從中檢出可能的關(guān)鍵詞,并給出相應(yīng)的確認(rèn)分值;再后,根據(jù)檢出的關(guān)鍵詞及其對應(yīng)的確認(rèn)分值產(chǎn)生相應(yīng)的對話或者控制命令對硬件進(jìn)行控制,同時利用已經(jīng)確認(rèn)的語音對識別器中的語音模型進(jìn)行更新。圖1給出了家電語音控制系統(tǒng)的結(jié)構(gòu)圖。


2 基于多識別引擎的識別器設(shè)計
2.1 傳統(tǒng)識別引擎簡介

  根據(jù)待識別語音屬于單一用戶還是公眾進(jìn)行分類,可以將其分為特定人識別以及非特定人識別。由于設(shè)計目標(biāo)是針對特定用戶的,因此采用特定人識別器。如果根據(jù)輸入語音特點以及建模方法進(jìn)行分類,當(dāng)前的識別引擎主要分為孤立詞識別、連續(xù)語音識別以及連接詞識別等引擎。下面分別介紹幾種不同的識別引擎以及各自的優(yōu)缺點。
2.1.1 孤立詞識別引擎
  由于孤立詞識別引擎的輸入是孤立的詞匯,因此其識別范圍小,建模精確,識別率高,非特定人的孤立詞識別引擎的識別率可達(dá)95%左右,特定人的識別率甚至可達(dá)99%以上。但是孤立詞識別引擎要求用戶的輸入必須是一個個獨立的單詞,顯然對于連續(xù)的語音流無法處理。即使是獨立的單詞,如果由于用戶的習(xí)慣或者生理原因,在語音中含有一些語氣詞或者其它高能量的突發(fā)噪聲,將嚴(yán)重影響系統(tǒng)的識別率。
2.1.2 連續(xù)語音識別引擎
  連續(xù)語音識別引擎是以音節(jié)或者音素為單位進(jìn)行建模的,很好地解決了孤立詞識別中對輸入語音的限制,而且通過對常見的語氣詞以及噪聲的建模,也能夠解決由其引起的識別率下降的問題。但是連續(xù)語音的識別率很低,即使在實驗室環(huán)境下,其識別率最高也只能達(dá)90%左右。顯然連續(xù)語音識別引擎難以單獨用于家電語音控制系統(tǒng)。
2.1.3 連接詞識別引擎
  連接詞識別引擎介于孤立詞識別引擎和連續(xù)語音識別引擎之間。它以孤立詞為模型,通過對孤立詞的拼接實現(xiàn)對連續(xù)語音流的識別。對于小型的語音識別系統(tǒng)來說,由于其詞表較小,因此建模方便,而且建模精度高,對關(guān)鍵詞的識別率接近于孤立詞識別引擎,很好地解決了孤立詞識別引擎無法解決的連續(xù)語音流問題。但是當(dāng)輸入語音流包含過多的音節(jié)時,其識別率不可避免地會下降很多。
  用戶在選擇識別引擎的時候,主要需要考慮的因素包括:識別率、實時響應(yīng)速度、魯棒性、輸入語音限制、使用舒適性等。
2.2 基于多識別引擎的識別器設(shè)計
  通過對識別引擎的分析以及對傳統(tǒng)識別引擎的介紹可以看到,無論單獨選擇哪種識別引擎,都不能夠完善地滿足實用的語音控制系統(tǒng)的要求,因此設(shè)計了一種多識別引擎的并行識別器,能夠獲得傳統(tǒng)識別器無法兼得的優(yōu)點。圖2給出了基于多識別引擎的識別器結(jié)構(gòu)圖。


2.2.1 基于多識別引擎的識別器工作原理
  圖2中,識別引擎1為孤立詞識別引擎;識別引擎2為連接詞識別引擎;識別引擎3為連續(xù)語音識別引擎。識別器具體的工作流程如下:
  (1)對輸入語音進(jìn)行預(yù)處理,包括語音信號的切分以及噪聲去除等。語音信號的切分采用的是基于能量窗計算的切分算法[1],使得語音信號的端點更準(zhǔn)確。
  (2)根據(jù)輸入語音的物理長度以及其它物理特征預(yù)判輸入語音為孤立詞輸入還是連續(xù)語音輸入。如果語音信號較短,則采用識別引擎1、2進(jìn)行識別;如果信號較長,則采用識別引擎2、3進(jìn)行識別;如果不能確定是孤立語音還是連續(xù)語音,則同時采用三個識別引擎進(jìn)行識別。
  (3)對于不同的識別引擎,將得到的識別結(jié)果作為候選關(guān)鍵詞(如果識別結(jié)果不同則為多候選)送入確認(rèn)模塊進(jìn)行確認(rèn)。
2.2.2 基于多識別引擎的識別器性能分析
  由于基于多識別引擎的識別器至少同時啟動了兩個或者三個識別引擎,因此系統(tǒng)的響應(yīng)時間不可避免地要受到影響。所以在語音建模時,采用參數(shù)共享的方式,從而降低了計算法復(fù)雜度,提高了系統(tǒng)響應(yīng)速度。同時注意到,對于孤立語音來說,由于識別引擎1、2的識別速度很快,因此完全可以滿足實時響應(yīng)的要求;對于連續(xù)語音來說,其識別時間主要耗費在識別引擎3上,這是不可避免的,系統(tǒng)引入的附加耗時很小,因此基本上不會因此而降低系統(tǒng)的響應(yīng)速度。
  而多識別引擎的識別器的建立,使得無論連續(xù)語音輸入還是孤立語音輸入,都能采用合適的識別引擎進(jìn)行識別,從而在允許用戶自由交流的基礎(chǔ)上,保證了系統(tǒng)的識別率得到大幅度的提高。尤其是用戶在采用連續(xù)語音輸入系統(tǒng)不能正確識別時,可以降低要求,視其為孤立語音輸入,這樣一方面可以正確控制家電正常運行,另一方面通過自適應(yīng),不同識別引擎的模型都得到了更為精確的刻畫,逐漸提高了系統(tǒng)識別率,從而使得連續(xù)語音識別率也得到了提高。另外,在各種情況下都采用了連接詞識別引擎,主要是考慮到殘疾用戶的語音中經(jīng)常附帶一些常見的突發(fā)噪聲以及語氣詞,因此通過對此進(jìn)行獨立建模,能夠去除語音信號首尾的噪聲和語氣詞的影響,進(jìn)一步提高識別器的魯棒性。
3 其它關(guān)鍵技術(shù)分析
  在家電語音控制系統(tǒng)中,除了識別器的性能嚴(yán)重影響系統(tǒng)的運行性能以外,關(guān)鍵詞確認(rèn)、對話控制策略以及識別器自適應(yīng)也是至關(guān)重要的:關(guān)鍵詞確認(rèn)的結(jié)果給出候選關(guān)鍵詞的置信度,因此直接影響了后續(xù)的對話控制模塊可能采取的動作——當(dāng)置信度高時,接受該關(guān)鍵詞將其作為真正的關(guān)鍵詞并且發(fā)出相應(yīng)的控制指令;當(dāng)置信度較低時,拒絕該候選詞;當(dāng)置信度處于中間水平時,產(chǎn)生相應(yīng)的對話語音與用戶進(jìn)一步進(jìn)行交互,對可能要發(fā)生的動作進(jìn)行確認(rèn)。在實際應(yīng)用中,自適應(yīng)技術(shù)保證了通過長期的用戶和系統(tǒng)之間的交互,對識別器的模型進(jìn)行修正,從而提高用戶的語音識別率。
  基于多識別引擎的識別器給關(guān)鍵詞確認(rèn)模塊提供了更多的候選關(guān)鍵詞,因此擴(kuò)大了關(guān)鍵詞的檢出范圍,為進(jìn)一步提高檢出率提供了條件;但是另一方面,更多的候選關(guān)鍵詞意味著錯誤的候選關(guān)鍵詞被接受的可能性也大大增加,系統(tǒng)的誤警率也會隨之上升。因此對于關(guān)鍵詞確認(rèn)性能的依賴也會更大,所以提取出多種有效的確認(rèn)特征,利用神經(jīng)元網(wǎng)絡(luò)進(jìn)行最終的置信度評價。這些確認(rèn)特征包括:音素匹配得分特征、音素數(shù)匹配得分特征、似然得分特征、似然排位得分特征以及模型距離差累積得分特征。詳細(xì)的確認(rèn)過程見參考文獻(xiàn)[2]
  在對話控制模塊中,由于不同的電器對應(yīng)著不同的關(guān)鍵詞,因此通過記錄當(dāng)前對話所處的狀態(tài)(應(yīng)用某一個電器的狀態(tài)或者空閑狀態(tài)),給識別器提供相應(yīng)于該狀態(tài)的關(guān)鍵詞表,大大縮小了關(guān)鍵詞表中關(guān)鍵詞的總數(shù),降低了關(guān)鍵詞之間的混淆度,從而進(jìn)一步提高了識別器的識別率。此外,對關(guān)鍵詞重要性進(jìn)行了分級,不同的關(guān)鍵詞擁有不同的級別,對于重要的關(guān)鍵詞來說,只有在其置信度很高的情況下才會將其直接發(fā)送給硬件控制模塊去執(zhí)行控制,否則要通過語音交互和用戶確認(rèn)的方法來確定是否執(zhí)行該命令。
  針對不同的識別器,采用不同的自適應(yīng)策略:由于噪聲模型和系統(tǒng)當(dāng)前所處狀態(tài)直接相關(guān),因此隨時準(zhǔn)備利用系統(tǒng)空閑狀態(tài)時采集的噪音段對噪聲模型進(jìn)行更新;對于孤立詞和連接詞識別引擎所采用的聲學(xué)模型來說,利用經(jīng)過確認(rèn)的語音段對相應(yīng)的模型進(jìn)行更新;對連續(xù)語音來說,由于只有對關(guān)鍵詞的置信度評價,很難保證非關(guān)鍵詞語音識別的正確性,因此只對關(guān)鍵詞模型進(jìn)行更新,在用戶空閑時,引導(dǎo)用戶利用給定的語音輸入對連續(xù)語音所采用的模型進(jìn)行更新,以達(dá)到模型自適應(yīng)的效果。
4 實驗及結(jié)果分析
  本文所采用的試驗平臺是用于連續(xù)語音電梯控制聲控仿真系統(tǒng)的關(guān)鍵詞檢出系統(tǒng)。整個系統(tǒng)由四個部分組成:語音識別模塊、語音確認(rèn)模塊、自適應(yīng)模塊以及對話管理模塊。語音識別模塊采用的是無跨越從左向右的CHMM模型,特征向量為39維的MFCC特征——12維的MEL特征系數(shù)以及一階和二階差分;能量及其一階和二階差分。確認(rèn)模塊采用的是基于多特征聯(lián)合得分的確認(rèn)算法[2]
  論文中所采用的語音數(shù)據(jù)庫包括三種類型:孤立語音——對應(yīng)系統(tǒng)中采用的關(guān)鍵詞命令;連續(xù)語音——每段語音中包含一個相應(yīng)的關(guān)鍵詞命令;含噪聲段的孤立語音——在關(guān)鍵詞命令對應(yīng)的語音前后有一小段高能量突發(fā)噪聲。另外,把這三種類型的語音混合起來得到了混合語音數(shù)據(jù)。系統(tǒng)中采用的關(guān)鍵詞包括:公用的關(guān)鍵詞——打開,關(guān)閉,是,否;用于電梯控制的關(guān)鍵詞——上升,下降,一層,二層,三層,四層;用于輪椅控制的關(guān)鍵詞——前進(jìn),后退,停止;用于電視控制的關(guān)鍵詞——向上,向下,一臺,二臺,三臺,四臺,五臺。對于不同識別引擎以及不同語音數(shù)據(jù),識別器的識別率以及系統(tǒng)的關(guān)鍵詞檢出率如表1所示。

  通過以上的實驗可以看出:對于三種不同的語音輸入,采用單一的識別引擎,不可避免地使得在某一種或幾種語音輸入下識別器的識別率以及系統(tǒng)的檢出率較低,極大地影響了系統(tǒng)的控制性能。當(dāng)采用基于多識別引擎的識別器時,在任一語音輸入類型下,無論是識別率還是檢出率都能夠達(dá)到使用單一識別器時最優(yōu)的效果。由此可見,在采用基于多識別引擎的識別器時,能夠充分利用不同識別引擎的優(yōu)勢,使得系統(tǒng)的性能得到最大的提升。
  本文針對傳統(tǒng)的單識別引擎在家電語音控制中存在的問題,提出了基于多識別引擎構(gòu)造語音識別器的方法,使得對于不同類型的語音輸入,都能夠得到較好的關(guān)鍵詞檢出效果,從而提高了系統(tǒng)的性能;同時,本文對語音控制系統(tǒng)中關(guān)鍵詞確認(rèn)、對話控制策略以及模型自適應(yīng)技術(shù)進(jìn)行了一定的分析和討論,并且搭建了完整的語音控制系統(tǒng)。目前本系統(tǒng)已經(jīng)通過了日本富士通公司的檢測,其相關(guān)硬件的研制工作正在進(jìn)行當(dāng)中,有望在近期取得聯(lián)調(diào)成功。
參考文獻(xiàn)
1 Dai Hai-sheng,Zhu Xiao-yan,Luo Yu-pin, Yang Shi-yuan. Robust Edge Eetection Method for Speech Recognition. ICSP, 2004
2 Dai Hai-sheng,Zhu Xiao-yan,Luo Yu-pin, Yang Shi-yuan.An Utterance Verification Algorithm in Keyword Spotting System.IbPRIA, 2005

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
国产精品vip| 亚洲国产老妈| 欧美成人高清| 久久国产精品久久国产精品| 亚洲自拍偷拍网址| 亚洲视频一区| 亚洲视频一起| 亚洲一区二区黄| 亚洲天堂网在线观看| 夜色激情一区二区| 99精品欧美一区二区三区综合在线| 亚洲国产日韩欧美一区二区三区| 久久激情五月丁香伊人| 亚洲电影免费观看高清完整版| 欧美伊人久久大香线蕉综合69| 亚洲欧美日韩国产| 午夜视频在线观看一区二区| 午夜欧美理论片| 欧美一级片在线播放| 欧美亚洲免费高清在线观看| 久久se精品一区精品二区| 久久丁香综合五月国产三级网站| 欧美在线综合| 最新中文字幕亚洲| 亚洲精品乱码久久久久久黑人| 亚洲清纯自拍| 亚洲三级视频在线观看| 亚洲精品综合精品自拍| 日韩亚洲精品视频| 在线亚洲电影| 亚洲欧美在线网| 久久国产视频网| 久久在线免费观看| 欧美成人xxx| 欧美日韩国产在线播放网站| 欧美午夜影院| 国产欧美日韩视频| 今天的高清视频免费播放成人| 亚洲黄色免费电影| 国产精品99久久99久久久二8 | 亚洲视频中文字幕| 午夜精品偷拍| 另类天堂av| 欧美日韩亚洲综合一区| 国产欧美日韩在线播放| 狠狠色伊人亚洲综合网站色| 亚洲欧洲日产国码二区| 亚洲午夜高清视频| 久久精品视频免费| 国产精品99久久99久久久二8| 欧美一区二区精品久久911| 麻豆亚洲精品| 国产精品成人一区二区网站软件 | 亚洲女性喷水在线观看一区| 亚洲电影免费观看高清完整版在线| 亚洲精选视频免费看| 亚洲欧美中文日韩v在线观看| 久久精品视频免费观看| 欧美区一区二区三区| 国产精品午夜av在线| 伊人色综合久久天天五月婷| 一区二区三区视频观看| 亚洲电影在线看| 亚洲淫片在线视频| 美女国产精品| 国产精品一区二区三区四区五区 | 久久国产精品99国产| 欧美激情精品久久久久| 国产精品影视天天线| 亚洲国产一区二区在线| 亚洲欧美日本国产专区一区| 99re热这里只有精品免费视频| 久久xxxx| 欧美视频日韩视频在线观看| 精品51国产黑色丝袜高跟鞋| 亚洲一区二区日本| 亚洲另类在线视频| 久久久噜噜噜久噜久久| 国产精品成人一区二区三区夜夜夜| 精品动漫3d一区二区三区免费版 | 国产日韩欧美日韩| 一本久久a久久精品亚洲| 亚洲第一免费播放区| 午夜精品久久久久久久久久久久| 欧美电影美腿模特1979在线看| 国产精品美女久久久浪潮软件| 亚洲啪啪91| 亚洲国产成人av在线| 欧美在线看片a免费观看| 欧美视频免费| 亚洲精品日韩激情在线电影| 亚洲国产欧美日韩精品| 久久精品国产免费| 国产精品三级视频| 99视频一区| 日韩一级黄色av| 欧美成人视屏| 激情欧美日韩| 久久国产免费| 久久国内精品自在自线400部| 欧美性事免费在线观看| 亚洲人成在线免费观看| 亚洲区一区二| 免费黄网站欧美| 狠狠噜噜久久| 欧美一区激情| 久久久噜噜噜久久狠狠50岁| 国产日韩欧美精品综合| 亚洲欧美日韩国产精品| 午夜精品久久久久久久久久久| 欧美性生交xxxxx久久久| 99这里有精品| 在线综合+亚洲+欧美中文字幕| 欧美精品在线免费播放| 激情综合在线| 亚洲国产岛国毛片在线| 老司机亚洲精品| 在线国产日韩| 亚洲免费观看| 欧美日本二区| 日韩视频不卡中文| 亚洲视频福利| 欧美视频精品在线观看| 在线视频欧美日韩精品| 亚洲欧美另类久久久精品2019| 国产精品激情电影| 亚洲一区二区三区欧美| 午夜一区在线| 国产日韩成人精品| 久久av二区| 你懂的国产精品| 亚洲人成在线影院| 亚洲在线1234| 国产精品自拍网站| 欧美在线亚洲在线| 六十路精品视频| 亚洲日本成人网| 亚洲一级网站| 国产女主播一区二区| 欧美在线观看一区二区| 久久婷婷综合激情| 亚洲一区二区三区在线观看视频| 亚洲女同性videos| 国产精品久久久免费| 亚洲女性喷水在线观看一区| 久久精品国产清高在天天线 | 国产一区二区精品久久99| 久久精品91| 欧美黄网免费在线观看| 妖精成人www高清在线观看| 欧美亚洲一区二区三区| 国语自产精品视频在线看| 亚洲区中文字幕| 欧美系列精品| 欧美伊人久久久久久午夜久久久久 | 国产亚洲欧美日韩一区二区| 亚洲福利在线视频| 欧美日韩国产三区| 亚洲欧美日韩综合aⅴ视频| 另类专区欧美制服同性| 日韩视频免费| 久久久精品免费视频| 亚洲精品久久久一区二区三区| 亚洲一区精品电影| 狠久久av成人天堂| 99re热这里只有精品免费视频| 国产精品羞羞答答| 亚洲精品激情| 国产精品日本精品| 91久久久亚洲精品| 国产精品视频一区二区三区| 亚洲韩国精品一区| 国产精品v片在线观看不卡| 欧美诱惑福利视频| 欧美精品三级| 午夜精品在线| 欧美日韩精品不卡| 久久精品99国产精品| 欧美三级乱码| 亚洲国产精品久久久久秋霞影院 | 亚洲欧美偷拍卡通变态| 国产精品伦一区| 最新国产の精品合集bt伙计| 国产精品久久久久国产精品日日| 久久大逼视频| 国产精品草莓在线免费观看| 亚洲国产综合91精品麻豆| 国产精品一区二区三区四区 | 狠狠久久婷婷| 亚洲免费人成在线视频观看| 黑人巨大精品欧美一区二区| 亚洲一区二区三区色| 1769国内精品视频在线播放| 亚洲欧美一区在线| 亚洲三级电影全部在线观看高清 | 久久免费偷拍视频| 一区二区三区四区五区在线 | 欧美人与禽性xxxxx杂性| 久久精品欧美日韩精品| 国产精品青草久久|