《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > 一種基于PCA的段級特征
一種基于PCA的段級特征
來源:電子技術應用2011年第5期
張興明,王科人,黃山奇
國家數字交換系統工程技術研究中心, 河南 鄭州 450002
摘要: 提出了一種基于PCA的段級特征(PCAULF)。該特征以現有的幀級語音特征為基礎,通過計算段級特征引入了語音的長時特性。對段級特征使用PCA降維,一方面去除由于引入段級特征帶來的冗余,實現數據降維,提高識別速度;另一方面抑制了噪聲對識別系統的影響,提高了段級特征的魯棒性。在訓練階段,計算所有語音的段級特征,使用PCA方法得到變換矩陣;在測試階段,先使用變換矩陣對段級特征進行降維,再進行判別。實驗結果表明,采用該特征有效地提高了識別精度和速度,更加適用于實時說話人識別系統。
中圖分類號: TN912.3
文獻標識碼: A
文章編號: 0258-7998(2011)05-0110-04
A PCA-based utterance level feature
Zhang Xingming, Wang Keren, Huang Shanqi
National Digital Switch System Engineering & Technological R & D Center, Zhengzhou 450002, China
Abstract: A PCA based utterance level feature (PCAULF) is proposed for speaker recognition. Based on existing frame level speech feature, this feature takes long-time characteristics of speech into account by calculating the utterance level feature. In this feature extraction algorithm, PCA method is used for dimension reduction of utterance level feature. On the one hand, PCA removes redundancy caused by utterance level feature, which realizes dimension reduction and improves recognition speed; on the other hand, it suppresses the effect of noise to recognition, which improves robustness. In the training phase, utterance level features of all the speech are calculated, and transformation matrix is received through PCA method; in the testing phase, utterance level feature is dimension-reduced before being discriminated. Experimental results show that this feature can effectively improve the accuracy and speed of recognition, and it’s more suitable for real-time speaker recognition systems.
Key words : PCAULF; utterance level feature; speaker recognition; PCA; robustness


 一個典型的說話人識別系統提取的說話人特征通常為時變特性參數如梅爾倒譜系數MFCC(Mel-Frequency Cepstrum Coefficients)[1]、感知線性預測系數PLP(Perceptual Linear Prediction)[2]或韻律特征[3]。然而,實際使用時由于受到噪音干擾,或者訓練與識別傳輸通道不匹配,識別系統通常不能表現良好[4]。目前解決這一問題的手段主要集中在特征域、模型域和得分域。現有特征域魯棒性處理方法主要有:RASTA濾波[5]、倒譜均值歸一化(CMN)[6]、直方圖均衡[7]和倒譜規整[8-11]等。這些算法通常以在識別前增加額外的運算來換取魯棒性的提高,如統計概率密度分布及計算各階矩等。
    本文算法主要從特征域入手,旨在減少識別階段運算時間的同時提高識別系統的魯棒性。參考文獻[12]采用了觀察值的各階矩和中心矩作為段級特征,并與模型結合,在不顯著影響識別率的情況下提高了識別速度。其缺點是,采用段級特征與采用幀級特征相比較識別率較低。參考文獻[13]提出了一種改進的PCA方法用于掌紋識別,通過提取更有利于分類的基向量,提高了降維后特征的魯棒性。本文結合了兩者的優點,提出了一種基于PCA的段級特征PCAULF(PCA based Utterance Level Feature)提取算法。該算法特點如下:
 (1)以段級特征代替幀級特征,可減少識別過程中模板匹配的次數,通過減少運算量來提高識別速度;
 (2)在段級特征降維時引入改進的PCA算法,一方面實現了數據的降維,既抑制了噪聲對識別系統的影響,又提高了識別的速度;另一方面,選擇更利于分類的特征向量組成變換矩陣,提高識別系統的魯棒性。
 實驗結果表明,在三種不同噪聲背景下進行測試比對,段級特征獲得了較高的識別率和較快的識別速度。
1 段級特征提取算法
1.1 段級特征的定義

     由于語音的短時平穩特性,可以考慮在一段語音中提取特征,這樣就使得同樣的語音長度用更少的語音特征去描述,該特征被稱為段級特征。它是和傳統的按幀提取語音特征相對應的一個概念。段級特征的一般表示形式是:

其中,ULFi、ULFi′代表第i個段級特征矢量,式(1)表示ULFi′從連續的G幀語音信號s中直接提取,式(2)表示ULFi從連續的G個幀級特征矢量a中提取。使用段級特征的關鍵在于段長G的選取和函數fG(·)的選取。首先討論函數的選取,段級特征是觀察值的函數。本文中,fG(·)主要包括以下兩個步驟:
 (1)以G為段長、Ginc為段移,將G個幀級特征矢量組合成超矢量。組成超矢量的操作類似于對數據的取幀操作,如圖1所示。

    (2)采用改進的主成分分析方法對超矢量進行降維,得到段級特征。

 


1.2 PCA方法
 主成分分析PCA(Principal Component Analysis)是一種掌握事物主要矛盾的統計分析方法,它可以從多元事物中解析出主要影響因素,簡化復雜的問題。PCA假定具有大變化的方向的數據比有很少變化的方向上的數據攜帶有更多的信息,因而它尋找具有最大方差的那些稱之為主軸的方向來表征原始數據。計算主成分的目的是在最小均方誤差意義下將高維數據投影到較低維空間。

的形式有效表示X。其中,通過K-L變換(Karhunen-Loeve Transform)計算相互正交的一組基向量,可以得到P。
 具體的PCA分析步驟如下:
 
2 實驗配置及結果分析
 采用PCAULF作為特征參數的說話人識別模型如圖2所示。語音數據經過預處理和特征提取兩個步驟,得到幀級特征矢量集。訓練時,由PCA對所有語音的段級特征求取降維變換矩陣,之后通過訓練得到模板參數;識別時,首先使用訓練時得到的變換矩陣對待測語音的段級特征進行降維,之后再通過模板匹配得到識別結果。

    語音數據采用TIMIT語音數據庫,隨機選取50人,每人共10條語音,每條語音長4~6 s,其中8條用于訓練,2條用于識別,保證了訓練與識別語音的不一致。噪聲庫采用NoiseX-92專業噪聲庫中的三種常見噪聲,分別為平穩高斯白噪聲、粉噪聲和Babble噪聲?;€系統聲學特征采用能量和12階MFCC特征以及衍生的ΔMFCC,共26維,之后進行了倒譜提升和RASTA濾波;模型采用訓練和識別較為快速的矢量量化(VQ),碼本大小取32。語音采樣頻率為8 kHz,幀長為32 ms,幀移為12.5 ms。
 本節主要開展了以下三個實驗:
 實驗一:對純凈的語音進行訓練,以段長分別為G=1,2,…,8,段移分別為Ginc=1,2,…,G求取段級特征,設累積貢獻率門限為1,得到變換矩陣(該變換矩陣并沒有實現降維);在識別階段,先對G幀語音特征組成的超矢量進行變換,再測試其識別率。該實驗主要用于分析合適的段長和段移。
 實驗二:在純凈語音基礎上,以信噪比SNR(Signal Noise Ratio)為20 dB、10 dB、5 dB分別混疊了NoiseX-92專業噪聲庫中的平穩高斯白噪聲(White)、粉噪聲(Pink)和Babble噪聲(Babble),取實驗一分析得出的段長和段移,采用不同的PCA降維參數,對幀級特征和段級特征進行變換,測試識別率,并對各種噪聲和SNR條件下的識別率求平均,得到不同PCA參數所對應的識別率。該實驗主要用于分析降維參數對識別率的影響。
 實驗三:根據實驗一、二得到的段長、段移和降維參數,采用實驗二的加噪方法對純凈語音進行加噪,對段級特征、經過PCA降維處理的幀級特征以及基線系統的幀級特征的識別性能進行了測試。該實驗主要用于對本文提出的算法的識別精度和速度進行測試。
2.1 段長與段移分析
 實驗一結果如表1所示。

    由表1可見,當以幀級特征作為訓練和識別的特征時,其識別率明顯低于經PCA方法變換后的段級特征的識別率??傮w來說,當G固定時,隨著Ginc的增加,識別率逐漸降低;當Ginc固定時,隨著G的增加,識別率也逐漸降低。當G≥8時,段級特征識別率不如幀級特征。當G=1,Ginc=1時,等效為直接用PCA方法對幀級特征進行變換。由于幀級特征(能量+MFCC+ΔMFCC)中計算一階差分時引入了冗余,PCA方法正是為了去除各個主成分之間的冗余,故經PCA變換后的幀級特征(G=1,Ginc=1)擁有更好的識別性能。但當語音信號為帶噪數據時,該特征識別性能不如段級特征(見2.3節)。
 由于當G和Ginc均較大時,模板匹配次數減小,識別速度會得到明顯提高,因此,為了兼顧識別速度和精度,結合表1的結果,本文選取G=6,Ginc=4。
2.2 PCA降維參數分析
 實驗二結果如圖3(a)、(b)所示。其中,PCA參數主要指的是設定的累積貢獻率門限,即選用累積貢獻率不小于累積貢獻率門限的多個特征矢量組成降維變換矩陣。

    由圖3(a)可見,對于幀級特征,當訓練語音和待測語音較純凈時,累積貢獻率門限值越大,識別率越高。圖3(b)表明,對于段級特征,累積貢獻率門限值位于94%附近時,識別效果較好。門限太大易造成噪聲參與識別,影響識別精度;門限太小,易造成降維后的特征包含語音信息不充分,雖然能提高識別速度,但卻降低了識別精度。因此,本文在進行PCA降維時,選用累積貢獻率不小于94%的特征向量組成降維變換矩陣。
2.3 帶噪環境下基于PCAULF的說話人識別系統性能分析
 實驗三結果如圖4~圖6所示。

 由圖4~6可以看出:(1)總體來說,在三種常見噪聲環境下,段級特征與經PCA降維后的幀級特征識別率相近,均高于直接采用幀級特征時的識別率。(2)由于段級特征引入了長時特征,且PCA降維在一定程度上抑制了噪聲對識別的影響,因此,在SNR較低時(SNR<20 dB時)具有更好的魯棒性。
 以上實驗的PC配置為:Intel Core(TM)2 Duo CPU E7500 @2.93 GHz,1.96 GB內存。三種特征在所有語音的識別階段的平均運算時延如表2所示。

    可見,由于識別時,模板匹配的運算時延遠大于對數據進行降維的運算時延,而段級特征的引入帶來了模板匹配次數的減小,因此,段級特征在識別階段的運算速度明顯大于幀級特征,約為幀級特征的2.8倍,更加適用于實時說話人識別系統。
    本文以現有的幀級語音特征為基礎,結合語音的長時特性和改進PCA方法,提出了一種適用于說話人識別的段級語音特征,并分析了算法中的參數對識別性能的影響。實驗結果表明,該算法在提高語音特征魯棒性的同時,提高了識別速度,適用于實時說話人識別系統。
參考文獻
[1] FURUI S. Digital speech processing, synthesis, and recognition[M]. New York: Marcel Dekker, 2001.
[2] GISH H, SCHMIDT M. Text independent speaker identification[J]. IEEE Signal Proc, 1994,11(4):18-32.
[3] REYNOLDS D A. The super SID project: Exploiting high level information for high accuracy speaker recognition[A]. In IEEE International Conference on Acoustics, Speech and Signal Processing[C]. Hong Kong, China, 2003:784-787.
[4] DRYGAJLO A,MALIKI M E. Speaker verification in noisy environments with combined spectral subtraction and missing feature theory[A]. In IEEE International Conference on  Acoustics, Speech and Signal Processing[C]. Seattle, USA, 1998,1:121-124.
[5] HERMANSKY H, MORGAN N. Rasta processing of speech[J]. IEEE Trans on Speech and Audio Processing. 1994,2(4):578-589.
[6] WANG L ,KITAOKA N,NAKAGAWA S. Analysis of effect of compensation parameter estimation for CMN on speech/speaker recognition[A]. In 9th International Symposium on Signal Processing and Its Applications(ICASSP&rsquo;07)[C]. Sharjah, 2007:1-4.
[7] TORRE A, SEGURA J C,BENITEZ C. Non-linear transformations of the feature space for robust speech recognition[A]. In IEEE Proc. Of ICASSP[C]. Orlando, USA, 2002:401-404.
[8] VIIKKI O, LAURILA K. Cepstral domain segmental feature vector normalization for noise robust speech recognition[J].  Speech Communication, 1998, 25(1):133-147.
[9] HSU C W, LEE L S. High order cestral moment normalization(HOCMN) for robust speech recognition[A]. In IEEE Proc of ICASSP[C]. Montreal, Canada, 2004:197-200.
[10] LIU B, DAI L R,LI J Y. Double gaussian based feature normalization for robust speech recognition[A]. In Proc of ISCSLP[C]. Hong Kong, 2004:253-256.
[11] DU J, Wang Renhua. Cepstral shape normalization(CSN) for robust speech recognition[A]. In Proc of ICASSP[C]. Las Vegas, USA, 2008: 4389-4392.
[12] 王波, 徐毅瓊, 李弼程. 基于段級特征的對話環境下說話人分段算法[J]. 計算機工程與應用, 2007, 28(10):2401-2416.
[13] 任蘇亞, 基于改進的PCA和ICA算法的掌紋識別研究[D]. 北京: 北京交通大學, 2007:35-39.
[14] NALIN P S, MAYUR D J, PRAKASH C,et al. Palm  print recognition: two level structure matching[A]. In Proc.  of IJCNN [C]. Vancouver, Canada, 2006: 664-669.

此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲第一福利视频| 中文精品一区二区三区| 欧美日韩午夜精品| 欧美国产日韩一二三区| 蜜臀99久久精品久久久久久软件 | 国产精品久久一卡二卡| 欧美日韩在线播放三区四区| 欧美精品18| 欧美激情精品久久久久久免费印度| 免费在线日韩av| 欧美激情精品久久久久久大尺度| 欧美福利在线观看| 欧美极品aⅴ影院| 欧美日韩精品一本二本三本| 欧美日韩aaaaa| 欧美视频免费在线观看| 国产精品高潮粉嫩av| 欧美亚男人的天堂| 国产精品日韩精品| 国产午夜精品久久久| 国产一区二区三区在线观看免费视频| 国产一区二区三区黄视频| 国产主播一区二区三区四区| 一区二区三区在线不卡| 亚洲国产一区视频| 99精品国产热久久91蜜凸| 亚洲性xxxx| 欧美一区二区在线| 欧美一区免费视频| 亚洲国产另类精品专区| 亚洲精品综合久久中文字幕| 一区二区欧美国产| 西瓜成人精品人成网站| 久久久久久久综合色一本| 你懂的亚洲视频| 欧美日韩综合一区| 国产乱子伦一区二区三区国色天香| 国产日韩在线播放| 在线精品观看| 一区二区三区久久| 欧美一区二区啪啪| 亚洲精品中文字幕女同| 亚洲欧美一区在线| 久久夜色精品国产| 欧美精品一线| 国产日韩免费| 亚洲日本激情| 性做久久久久久久免费看| 亚洲韩国一区二区三区| 亚洲一二三级电影| 另类av一区二区| 欧美日韩中文另类| 国产一区二区三区观看| 亚洲精品一区二区在线| 亚洲欧美另类在线观看| 日韩视频不卡| 久久精品国产91精品亚洲| 欧美精品性视频| 国产亚洲一级| 亚洲伦理在线观看| 欧美在线国产精品| 亚洲小说欧美另类社区| 久久久五月婷婷| 欧美日韩综合在线| 在线电影一区| 亚洲欧美日韩在线观看a三区 | 国产免费成人av| 亚洲激情网站免费观看| 午夜综合激情| 亚洲午夜激情| 欧美aⅴ一区二区三区视频| 国产精品亚洲综合一区在线观看| 亚洲电影在线观看| 欧美亚洲专区| 亚洲一卡二卡三卡四卡五卡| 久久综合狠狠综合久久综青草| 国产精品高潮呻吟久久av黑人| 在线欧美日韩精品| 午夜精品久久久久久久| 一区二区高清在线观看| 欧美69wwwcom| 国内精品视频666| 亚洲综合首页| 亚洲午夜激情| 欧美福利电影网| 国内精品久久国产| 亚洲在线成人| 亚洲一区二区欧美| 欧美成人视屏| 国产一区二区三区在线播放免费观看| 在线一区欧美| 亚洲三级电影全部在线观看高清| 久久精品一区二区三区不卡牛牛| 国产精品久久久爽爽爽麻豆色哟哟| 亚洲高清在线精品| 欧美一区观看| 久久成人精品| 国产精品网站在线观看| 一区二区国产日产| 99精品国产福利在线观看免费| 久久精品国产精品亚洲综合| 国产精品久久久久久久久久免费 | 亚洲国产精品成人一区二区| 欧美一区二区三区四区视频| 午夜亚洲性色福利视频| 国产精品video| 一区二区三区欧美视频| 一本色道久久加勒比88综合| 欧美精品久久久久久久| 亚洲国产福利在线| 91久久国产综合久久蜜月精品| 久久婷婷国产综合精品青草| 国产一区二区三区高清在线观看 | 欧美日韩精品一区二区天天拍小说 | 久久精品人人做人人爽电影蜜月| 久久大逼视频| 国产日韩在线一区| 欧美专区在线| 麻豆久久婷婷| 亚洲二区视频| 99精品国产99久久久久久福利| 欧美激情欧美狂野欧美精品| 最新中文字幕一区二区三区| 99精品国产高清一区二区| 欧美日本在线一区| 亚洲免费观看高清完整版在线观看熊 | 久久中文久久字幕| 在线免费观看成人网| 亚洲精品日韩久久| 欧美精品日韩综合在线| 亚洲黄色在线| 亚洲一区二区三区四区视频| 国产精品久久久久久久午夜| 亚洲欧美另类在线| 久久综合久久88| 亚洲精品欧美在线| 亚洲男女自偷自拍| 国产麻豆一精品一av一免费| 欧美在线亚洲在线| 欧美成人蜜桃| 欧美主播一区二区三区| 亚洲少妇自拍| 亚洲精品在线看| 欧美天天综合网| 性感少妇一区| 欧美大尺度在线| 99精品热视频| 欧美在线观看视频一区二区三区| 国产主播一区二区三区四区| 亚洲精选91| 国产精品欧美一区喷水 | 夜夜精品视频| 国产精品久久久久毛片软件| 久久高清国产| 欧美日韩免费高清| 亚洲免费网址| 欧美大片一区二区| 亚洲视频一区在线| 久久这里有精品视频| 亚洲国产日韩欧美| 午夜亚洲福利在线老司机| 伊人久久亚洲美女图片| 亚洲无亚洲人成网站77777| 国产一区二区三区在线免费观看 | 日韩视频中午一区| 国产精品一区二区三区久久久| 亚洲第一页自拍| 国产精品va| 91久久极品少妇xxxxⅹ软件| 国产精品啊v在线| 亚洲激情视频在线| 国产精品女人久久久久久| 亚洲国产黄色片| 国产精品美女诱惑| 亚洲精品乱码久久久久久久久| 国产精品欧美久久| 99re热这里只有精品免费视频| 国产日韩一区二区三区在线播放 | 欧美国产日韩xxxxx| 亚洲综合视频一区| 欧美精品一区三区在线观看| 午夜国产精品视频| 欧美伦理在线观看| 午夜精品久久久久久久久久久久| 欧美激情网站在线观看| 欧美一区二区三区在线看| 欧美日韩国产三级| 久久精品99无色码中文字幕 | 亚洲精品久久久久久下一站| 久久国产日韩| 一区二区三区日韩精品| 欧美成人综合| 欧美综合77777色婷婷| 国产精品扒开腿爽爽爽视频 | 亚洲图色在线| 欧美国产日韩一区二区在线观看| 午夜精品久久久99热福利| 欧美视频在线免费| 99re6这里只有精品| 在线观看不卡av|