《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信與網(wǎng)絡(luò) > 設(shè)計(jì)應(yīng)用 > 基于DTW的編碼域說話人識別研究
基于DTW的編碼域說話人識別研究
來源:電子技術(shù)應(yīng)用2010年第8期
李榕健, 于洪濤, 李邵梅
國家數(shù)字交換系統(tǒng)工程技術(shù)研究中心, 河南 鄭州 450002
摘要: 相對解碼重建后的語音進(jìn)行說話人識別,從VoIP的語音流中直接提取語音特征參數(shù)進(jìn)行說話人識別方法具有便于實(shí)現(xiàn)的優(yōu)點(diǎn),針對G.729編碼域數(shù)據(jù),研究基于DTW算法的快速說話人識別方法。實(shí)驗(yàn)結(jié)果表明,在相關(guān)的說話人識別中, DTW算法相比GMM 在識別正確率和效率上有了很大提高。
中圖分類號: TN912.3
文獻(xiàn)標(biāo)識碼: A
文章編號: 0258-7998(2010)08-0119-03
Research on speaker recognition from coding domain based on DTW algorithm
LI Rong Jian, YU Hong Tao, LI Shao Mei
National Digital Switching System and Researching Center, Zhengzhou 450002, China
Abstract: The direct extraction of speech feature parameters from VoIP voice stream for speaker recognition in relation to reconstructing the decoded speech for speaker recognition has the advantages of easy implementation.This paper focuses on data in G.729 coding domain and proposes a method of quick speaker recognition based on DTW algorithm. Experimental results show that, compared with GMM, DTW has advantage of high rcognition accuracy and process speed in the text-dependent speaker recognition.
Key words : speaker recognition; G.729 coding stream; voice feature parameter; DTW algorithm

 說話人識別又被稱為話者識別,是指通過對說話人語音信號的分析處理,自動確認(rèn)說話人是否在所記錄的話者集合中,以及進(jìn)一步確認(rèn)說話人的身份。說話人識別的基本原理如圖1所示。

   按照語音的內(nèi)容,說話人識別可以分為文本無關(guān)的(Text-Independent)和文本相關(guān)的(Text-Dependent)兩種。文本無關(guān)的識別系統(tǒng)不規(guī)定說話人的發(fā)音內(nèi)容,模型建立相對困難,但用戶使用方便。與文本有關(guān)的說話人識別系統(tǒng)要求用戶按照規(guī)定的內(nèi)容發(fā)音,而識別時也必須按規(guī)定的內(nèi)容發(fā)音,因此可以達(dá)到較好的識別效果。
 隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,通過Internet網(wǎng)絡(luò)傳遞語音的網(wǎng)絡(luò)電話VoIP(Voice over IP)技術(shù)發(fā)展迅速,已經(jīng)成為人們?nèi)粘=涣鞯闹匾侄危絹碓蕉嗟挠脩魭仐墏鹘y(tǒng)的通信方式,通過計(jì)算機(jī)網(wǎng)絡(luò)等媒介進(jìn)行語音交流。由于VoIP工作方式的特點(diǎn),語音在傳輸中經(jīng)過了語音編譯碼處理,VoIP設(shè)備端口同時要處理多路、海量的壓縮話音數(shù)據(jù)。所以VoIP說話人識別技術(shù)主要研究的是如何高速、低復(fù)雜度地針對解碼參數(shù)和壓縮碼流進(jìn)行說話人識別。
 現(xiàn)有的針對編碼域說話人識別方法的研究主要集中在編碼域語音特征參數(shù)的提取上,香港理工大學(xué)研究從G.729和G.723編碼比特流以及殘差中提取信息,并采用了分?jǐn)?shù)補(bǔ)償?shù)姆椒āV袊茖W(xué)技術(shù)大學(xué)主要研究了針對AMR語音編碼的說話人識別。西北工業(yè)大學(xué)在說話人確認(rèn)中針對不同的語音編碼差異進(jìn)行了補(bǔ)償算法研究,并且研究了直接在G.729編碼的比特流中提取參數(shù)的方法。說話人模型則主要采用在傳統(tǒng)說話人識別中應(yīng)用最廣泛的GMM-UBM(Gaussian Mixture Model-Universal Background Model)。GMM-UBM的應(yīng)用效果和混元數(shù)目密切相關(guān),在保證識別率的基礎(chǔ)上,其處理速度無法滿足VoIP環(huán)境下高速說話人識別的需求。
 本文研究VoIP語音流中G.729編碼域的說話人實(shí)時識別,將DTW識別算法成功應(yīng)用在G.729編碼域的文本相關(guān)的說話人實(shí)時識別。
1 G.729編碼比特流中的特征提取
1.1  G.729編碼原理

 ITU-T在1996年3月公布G.729編碼,其編碼速率為8 kb/s,采用了對結(jié)構(gòu)代數(shù)碼激勵線性預(yù)測技術(shù)(CS-ACELP),編碼結(jié)果可以在8 kb/s的碼率下得到合成音質(zhì)不低于32 kb/s ADPCM的水平。 G.729的算法延時為15 ms。由于G.729編解碼器具有很高的語音質(zhì)量和很低的延時,被廣泛地應(yīng)用在數(shù)據(jù)通信的各個領(lǐng)域,如VoIP和H.323網(wǎng)上多媒體通信系統(tǒng)等。
    G.729的編碼過程如下:輸入8 kHz采樣的數(shù)字語音信號先經(jīng)過高通濾波預(yù)處理,每10 ms幀作一次線性預(yù)測分析,計(jì)算10階線性預(yù)測濾波器系數(shù),然后把這些系數(shù)轉(zhuǎn)換為線譜對(LSP)參數(shù),采用兩級矢量量化技術(shù)進(jìn)行量化。自適應(yīng)碼本搜索時,以原始語音與合成語音的誤差知覺加權(quán)最小為測度進(jìn)行搜索。固定碼本采用代數(shù)碼本機(jī)構(gòu)。激勵參數(shù)(自適應(yīng)碼本和固定碼本參數(shù))每個子幀(5 ms,40個樣點(diǎn))確定一次。
1.2 特征參數(shù)提取
    直接從G.729 編碼流中按照量化算法解量化可以得到LSP參數(shù)。由于后段的說話人識別系統(tǒng)還需要激勵參數(shù),而在激勵參數(shù)的計(jì)算過程中經(jīng)過了LSP的插值平滑,所以為了使特征矢量中聲道和激勵參數(shù)能準(zhǔn)確地對應(yīng)起來,要對解量化的LSP參數(shù)采用插值平滑。



 本文選擇G.729編碼幀中第一子幀的LSP(1)參數(shù)的反余弦LSF及由其轉(zhuǎn)換得到的LPC、LPCC參數(shù)作為聲道特征參數(shù)。
 參考文獻(xiàn)[1]發(fā)現(xiàn)識別特征加入G.729壓縮幀中的語音增益參數(shù),說話人識別性能發(fā)生了下降。去除G.729壓縮碼流特征中的增益參數(shù)GA1、GB1、GA2、GB2,結(jié)果發(fā)現(xiàn),當(dāng)采用了去除增益參數(shù)的特征矢量方案X=(L0,L1,L2,L3,P1,P0,P2),識別性能得到了提高,所以本文最終采用的G.729壓縮碼流特征為X=(L0,L1,L2,L3,P1,P0,P2),共7維。
2 動態(tài)時間規(guī)整(DTW)識別算法
 動態(tài)時間規(guī)整DTW(Dynamic Time Warping)是把時間規(guī)整和距離測度計(jì)算結(jié)合起來的一種非線性規(guī)整技術(shù)。該算法基于動態(tài)規(guī)劃思想,解決了發(fā)音長短不一的模版匹配問題。
 算法原理:假設(shè)測試語音和參考語音分別用R和T表示,為了比較它們之間的相似度,可以計(jì)算它們之間的距離D[T,R],距離越小則相似度越高。具體實(shí)現(xiàn)中,先對語音進(jìn)行預(yù)處理,再把R和T按相同時間間隔劃分成幀系列:

   然后采用動態(tài)規(guī)劃進(jìn)行識別。如圖2所示。

   把測試模版的各個幀號n=1,…,N在一個二維直角坐標(biāo)系的橫軸上標(biāo)出,把參考模版的各幀號m=1,…,M在縱軸上標(biāo)出,通過這些表示幀號的整數(shù)坐標(biāo)畫出的橫縱線即可形成一個網(wǎng)格,網(wǎng)格中的每一個交叉點(diǎn)(n,m)表示測試模版中某一幀與訓(xùn)練模版中某一幀的交叉點(diǎn)。動態(tài)規(guī)劃算法可以歸結(jié)為尋找一條通過此網(wǎng)格中若干格點(diǎn)的路徑,路徑通過的格點(diǎn)即為測試和參考模版中距離計(jì)算的幀號。

 整個算法主要?dú)w結(jié)為計(jì)算測試幀和參考幀間的相似度及所選路徑的矢量距離累加。
 識別流程如圖3所示。

3  實(shí)驗(yàn)結(jié)果與性能分析及結(jié)論
 為測試上述識別性能,對其進(jìn)行了固定文本的說話人識別試驗(yàn)。試驗(yàn)中,采用電話信道863語料庫30個說話人共300個錄音文件,文件格式為16 bit線性PCM。為了模擬VoIP中語音壓縮幀,使用G.729聲碼器對原始語音文件進(jìn)行壓縮。使用每個說話人的一個文件訓(xùn)練成為模板。測試語音長度為10 s~60 s以5 s為間隔的共11個測試時間標(biāo)準(zhǔn)。這樣,模板庫中有30個模板,測試語音有270個,使用微機(jī)配置是:CPU Pentium 2.0 GHz,內(nèi)存512 MB。
 在實(shí)驗(yàn)中,M和N取64,通過各模版間的匹配,確定了判決門限為0.3時,識別效果最佳。
 為了對比DTW算法的識別性能,采用在傳統(tǒng)說話人識別中廣泛使用的GMM模型作為對比實(shí)驗(yàn),其中GMM模型使用與DTW算法相同的編碼流特征。
   圖4給出基于DTW識別方法與GMM模型(混元數(shù)64)識別G.729編碼方案863語料庫的文本相關(guān)說話人的誤識率對比圖。橫坐標(biāo)代表的測試語音的時長,縱坐標(biāo)代表識別誤識率。由實(shí)驗(yàn)結(jié)果可知在文本相關(guān)的說話人識別中,基于DTW算法的識別率在絕大多數(shù)情況下高于GMM模型,且隨著測試語音的增長,優(yōu)勢更明顯。

 為比較特征提取的時間性能和總的時間性能,實(shí)驗(yàn)條件如下:
   (1)選擇的50個說話人的語音只進(jìn)行特征提取,測試語音長度總和在25 min左右;
   (2)對測試語音分別進(jìn)行解碼識別和編碼流的識別,模板數(shù)為10個;
   (3)微機(jī)配置為:CPU Pentium 2.0 GHz,內(nèi)存512 MB。
   表1為特征提取時間比較結(jié)果,表2為說話人識別時間比較結(jié)果。

 由實(shí)驗(yàn)結(jié)果可以看出,在編碼比特流中進(jìn)行特征提取時間和識別的(上接第121頁)
時間都遠(yuǎn)小于解碼重建后的語音特征提取時間和識別時間,滿足實(shí)時說話人識別的需要。
    在文本相關(guān)的說話人識別中,對比使用同樣G.729壓縮碼流特征的GMM模型, DTW方法的識別率和處理效率均高于GMM模型,能夠?qū)崟r應(yīng)用于VoIP網(wǎng)絡(luò)監(jiān)管中。
參考文獻(xiàn)
[1]  石如亮.編碼域說話人識別技術(shù)研究[D].鄭州:解放軍信息工程大學(xué),2007.
[2]  PETRACCA M, SERVETTI A, DEMARTIN J C. Performance analysis of compressed-domain automatic speaker recognition as a function of speech coding technique and  bit rate [A]. In: International Conference on Multimedia and Expo (ICME) [C]. Toronto,Canada, 2006:1393-1396.
[3]  石如亮,李弼程,張連海,等. 基于編碼比特流的說話人識別[J].信息工程大學(xué)學(xué)報(bào),2007,8(3): 323-326.
[4]  王炳錫,屈丹,彭煊.實(shí)用語音識別基礎(chǔ)[M].北京:國防工業(yè)出版社,2004: 264-286.
[5]  李邵梅,劉力雄,陳鴻昶.實(shí)時說話人辨別系統(tǒng)中改進(jìn)的DTW算法[J].計(jì)算機(jī)工程,2008,34(4):218-219.
[6]  DUNN R B, QUATIERI T F, REYNOLDS D A. et al.  Speaker recognition from coded speech in matched and mismatched conditions [A]. In: Proc. Speaker Recognition Workshop’01 [C]. Grete, Greece, 2001:115-120.
[7]  AGGARWAL C C, OLSHEFSKI D, SAHA D et al. CSR: Speaker recognition from compressed VoIP packet stream [A]. In: International Conference on Multimedia and Expo (ICME) [C]. Amsterdam, Holand, 2005: 970-973.

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
国产视频不卡| 免费成人在线观看视频| 国产日韩欧美在线播放| 欧美极品色图| 亚洲欧美激情四射在线日 | 一区二区不卡在线视频 午夜欧美不卡在 | 欧美伦理91| 亚洲男人的天堂在线观看| 亚洲免费观看视频| 亚洲一区二区三区成人在线视频精品| 国产日韩一区二区| 国产精品一区久久| 久久综合中文字幕| 一区二区不卡在线视频 午夜欧美不卡' | 亚洲国产黄色| 日韩视频―中文字幕| 国产精品久久久久久一区二区三区| 久久精品视频在线看| 亚洲日本电影| 亚洲永久免费观看| **欧美日韩vr在线| 国产精品久久久久久久久久尿 | 国产欧美一区二区三区沐欲| 欧美不卡视频一区发布| 亚洲一区三区视频在线观看| 亚洲国产91精品在线观看| 久久丁香综合五月国产三级网站| 亚洲日本aⅴ片在线观看香蕉| 国产精品日韩专区| 能在线观看的日韩av| 噜噜噜躁狠狠躁狠狠精品视频| 男女av一区三区二区色多| 欧美本精品男人aⅴ天堂| 欧美精品18| 国产精品hd| 欧美黑人在线播放| 久久久久久久高潮| 亚洲综合三区| 欧美一区二区三区精品电影| 一本色道久久综合亚洲精品婷婷| 一本一道久久综合狠狠老精东影业| 亚洲图片欧美午夜| 亚洲人成在线播放网站岛国| 亚洲精品五月天| 久久精品国产亚洲aⅴ| 亚洲伊人久久综合| 欧美一区二区成人| 亚洲制服av| 久久riav二区三区| 亚洲精品视频在线观看免费| 中文在线不卡| 日韩一区二区电影网| 亚洲性视频h| 久久久精品国产一区二区三区| 欧美成人日本| 久久免费少妇高潮久久精品99| 99精品国产在热久久下载| 久久精品一二三区| 99国产精品自拍| 欧美亚洲日本国产| 亚洲欧美日本伦理| 久久深夜福利| 欧美日韩亚洲视频| 欧美日韩国产成人在线91| 欧美91精品| 国产精品国产三级国产专播精品人| 国产一区二区日韩精品欧美精品| 国产精品你懂的| 激情偷拍久久| 影音先锋亚洲精品| 狠狠爱www人成狠狠爱综合网| 国产精品永久免费在线| 精品动漫3d一区二区三区免费版| 亚洲日韩视频| 亚洲精品女av网站| 欧美亚洲一区二区在线观看| 日韩视频在线一区二区三区| 久久精品国产精品亚洲精品| 欧美在线观看一二区| 欧美一区二区成人| 欧美激情一区二区三区成人| 国产亚洲欧美一级| 在线亚洲+欧美+日本专区| 亚洲最黄网站| 一区二区三区精品视频| 亚洲国产成人久久综合一区| 亚洲欧美日韩人成在线播放| 午夜在线a亚洲v天堂网2018| 欧美成人一区二区在线| 国产亚洲成年网址在线观看| 一区二区三区日韩欧美| 亚洲精品综合精品自拍| 久久精品人人做人人爽电影蜜月| 欧美日韩在线精品| 亚洲国产裸拍裸体视频在线观看乱了| 亚洲欧洲精品一区二区三区| 欧美专区一区二区三区| 亚洲欧美久久| 欧美午夜精品电影| 亚洲欧洲在线视频| 亚洲人成网站精品片在线观看| 久久久久成人精品免费播放动漫| 国产精品久久久久久模特| 99成人精品| 亚洲一区二区在线| 日韩午夜免费视频| 欧美freesex8一10精品| 国产私拍一区| 亚洲影院污污.| 亚洲一区二区三区高清不卡| 欧美日韩福利在线观看| 亚洲欧洲一区二区天堂久久 | 国产精品成人一区二区三区夜夜夜| 亚洲国产欧洲综合997久久| 亚洲精品免费在线| 亚洲精品美女| 免费成人黄色片| 伊人成人网在线看| 久久精品一级爱片| 美女亚洲精品| 亚洲电影免费观看高清完整版在线观看| 久久狠狠久久综合桃花| 久久男女视频| 亚洲福利国产| 99re亚洲国产精品| 欧美激情视频一区二区三区在线播放| 亚洲缚视频在线观看| 亚洲精品美女在线观看| 欧美高清不卡| 亚洲人午夜精品免费| 中文在线一区| 国产精品久久久久毛片大屁完整版 | 亚洲国产日韩在线一区模特| 一区二区免费在线播放| 欧美电影专区| 亚洲黄色免费| 一区二区三区蜜桃网| 欧美日韩综合不卡| 韩日精品中文字幕| 亚洲高清视频在线| 暖暖成人免费视频| 亚洲日本成人| 亚洲专区国产精品| 国产精品一二一区| 欧美制服第一页| 免费成人黄色| 日韩午夜中文字幕| 亚洲欧美色一区| 国产亚洲欧洲一区高清在线观看| 久久xxxx| 欧美国产视频在线观看| 99精品免费网| 欧美一区二区三区免费视| 狠色狠色综合久久| 亚洲精品国精品久久99热| 欧美日韩亚洲高清一区二区| 亚洲免费网址| 美日韩精品视频免费看| 日韩午夜精品| 久久www成人_看片免费不卡| 永久域名在线精品| 中日韩视频在线观看| 国产免费一区二区三区香蕉精| 亚洲国产精品传媒在线观看| 欧美另类变人与禽xxxxx| 亚洲影音一区| 欧美超级免费视 在线| 中日韩美女免费视频网址在线观看 | 免费久久久一本精品久久区| 亚洲精品国久久99热| 欧美一区二视频| 亚洲黄色成人久久久| 欧美一区二区三区视频在线| 一区二区三区亚洲| 亚洲午夜视频在线| 红桃视频国产一区| 亚洲一区二区毛片| 激情久久五月| 亚洲免费在线精品一区| 影音先锋久久精品| 亚洲欧美日韩国产成人精品影院| 伊人成人网在线看| 先锋影院在线亚洲| 91久久精品国产91久久性色tv| 午夜一区不卡| 亚洲精品久久视频| 久久久国产午夜精品| 夜夜精品视频一区二区| 久热精品在线| 亚洲一区在线看| 欧美精品一区视频| 久久成人这里只有精品| 国产精品九九| 亚洲美女电影在线| 国产中文一区| 欧美在线观看视频一区二区三区 | 亚洲欧洲精品一区二区精品久久久 | 欧美大胆人体视频| 欧美一区二区三区四区高清 | 欧美日韩一区二区三区在线看|