《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 設計應用 > 基于PLDA的說話人識別時變魯棒性問題研究
基于PLDA的說話人識別時變魯棒性問題研究
2016年微型機與應用第05期
陳霄鵬,彭亞雄,賀松
(貴州大學 大數據與信息工程學院, 貴州 貴陽 550025)
摘要: 隨著時間的變化,人的聲音也會發生變化。這對說話人的識別帶來了一定的影響。通過研究發現,說話人識別的性能與時間有著線性變化的規律。傳統的說話人識別系統使用GMMUBM模型并不能很好地學習出線性變化規律。由于概率線性判別分析(PLDA)對于類內與類間有著很好的線性區分度,所以為了解決線性變化的問題,選擇概率線性判別分析的方法學習說話人識別中時變的線性變化規律。從實驗結果看出,PLDA對于說話人識別的識別魯棒性具有很好的提升。
Abstract:
Key words :

  陳霄鵬,彭亞雄,賀松

  (貴州大學 大數據與信息工程學院, 貴州 貴陽 550025)

  摘要:隨著時間的變化,人的聲音也會發生變化。這對說話人的識別帶來了一定的影響。通過研究發現,說話人識別的性能與時間有著線性變化的規律。傳統的說話人識別系統使用GMMUBM模型并不能很好地學習出線性變化規律。由于概率線性判別分析(PLDA)對于類內與類間有著很好的線性區分度,所以為了解決線性變化的問題,選擇概率線性判別分析的方法學習說話人識別中時變的線性變化規律。從實驗結果看出,PLDA對于說話人識別的識別魯棒性具有很好的提升。

  關鍵詞:說話人識別;時變魯棒性GMM-UBM;PLDA

0引言

  說話人識別即聲紋識別,為生物特征識別的一種。而聲紋這一概念從誕生之初就一直伴隨著其是否隨時間變化的質疑。經過多年的研究發現,聲紋識別確確實實隨著時間發生變化。早在2003年,Bonastre教授已發表論文指出說話人識別的時變問題。在實際的說話人識別系統中,聲紋預留與聲紋驗證之間的時間間隔也帶來了系統性能的下降。

  在已有的研究中,浙江大學CNNT實驗室設計了一個聲紋打卡系統,記錄了實驗室成員每天打卡情況,其中在開始的50天里識別率為69.02%,在稍近的幾天里識別率提高到了74.19%。同時提出了平滑化梅爾倒譜系數(Smoothing Mel Cepstrum Coefficient, SMFCC )這種更穩定的特征提高時變魯棒性。

  清華大學語音和語言技術中心王琳琳博士以Fratio作為中間準則計算頻帶區分度從而提高其魯棒性。同時還提出了性能驅動的頻率彎折方法的特征提取算法。

  以上研究都基于特征層面,并未涉及到模型層面,本文研究著重于模型層面。

1說話人識別的線性變化規律

  隨著時間的變化,人的聲音也會發生變化,從而影響說話人識別的識別率。其識別率會降低,而這種降低類似線性變化。所以,假設說話人識別中不同時間的特征之間的線性相關,通過特征之間的相關系數可以判別兩個特征之間的線性相關性。根據實驗結果發現,相關系數都在0.7~1之間,也就說明特征與特征之間有著極大的線性相關性。而且相關系數隨著時間的變化也有著相對的線性變化。實驗結果如圖1。

  

001.jpg

  為了更加準確地描述時間變化的規律,最大可能排除音素沒有對齊的影響,故而選擇動態時間規整(Dynamic Time Warping, DTW)對特征進行分析。將動態時間規整后的兩段語音求cosine距離,根據cosine距離觀察兩段語音的相似程度。實驗結果表明,cosine距離隨著時間的變化也呈現出相應的線性變化。實驗結果如圖2。

  

002.jpg

  由以上兩個實驗結果可以得出,隨著時間的變化,說話人識別的魯棒性呈線性變化規律。

2概率線性判別分析

  說話人識別是模式識別的一種,分為訓練和識別兩個階段。訓練可以認為就是將語音按照不同的人進行分類,每一類代表了一個人,識別就是將測試的語音與已經分好類的模型進行比對。在說話人識別中加入時間的變化,就要同時考慮同一類的變化,即類內的變化,以及類與類之間的變化,也即類間的變化。

  線性概率判別分析[13](Linear Discriminant Analysis,LDA)是一種將類內和類間的方差作為多維高斯分布的一種技術,它尋求方向空間最大的辨別力,因此非常適合支持類的識別任務。

  假設訓練數據為不同的I個人,且每個人有J個語音,xij表示第i 個人的第j個語音,則LDA模型可表示為:

  xij=μ+Fhi+Gwij+ij(1)

  此模型分為兩個部分:第一個部分μ+Fhi只與每個個體的特征有關,而與每條語音的特征無關;第二個部分Gwij+ij指每個個體語音的不同以及代表個體內部的噪聲。其中μ為訓練數據集的總體平均數;矩陣F的列包含了個人之間子空間的主要成分;hi代表這個子空間的位置;矩陣G包含了個體內部子空間的主要成分;wij代表這個子空間的位置;ij定義為高斯對角線協方差Σ(殘差)。從條件概率方面來描述式(1)的模型:

  Pr(xij|hi,wij,θ)=x[μ+Fhi+Gwij,Σ](2)

  Pr(hi)=h[0,I] (3)

  Pr(wij)=w[0,I](4)

  式a[b,C]中,a為變量,b為期望,C為方差的高斯分布。式(2)~式(4)都是同樣的高斯分布。

  2.1訓練階段

  訓練階段的主要目標是得到一組數據點xij,并且得到相應的參數θ={μ,F,G,Σ}。如果知道隱藏變量hi和wij的值,這個問題將變得十分簡單。同樣地在給定θ的情況下也很容易估計hi和wij。但是式(1)中的很多參量都是未知的。

  使用EM算法[45]可以解決這個問題。EM算法通過迭代輪流估計兩個參數。在Estep,計算出整個后驗分布中的隱藏變量hi和wij,從而修正參數的值。在Mstep,使參數θ={μ,F,G,Σ}的點估計最優化。

  2.2識別階段

  在識別階段,需要比較數據在R個模型M1…R下的似然分。定義模型M代表了隱藏身份變量hi和數據的一種關系。如果測試集中的多條語音屬于同一個人,那么這些語音就需要一個相同的身份變量hi。反之如果多條語音對應了多個人,那么就需要不同的身份變量。因此需要得到第q個模型的似然分Pr(X|Mq),其中X是所有的觀察數據。為了計算每個模型的后驗概率,需要使用貝葉斯準則[68]:

  4T@M6OG8CGLUO8H~@G@BU0A.png

003.jpg

  為了更真實地描述這個公式,假設訓練語音為x1、x2,測試語音為xp。如圖3所示,圖中有兩個模型,模型M1的測試語音xp與訓練語音x1相匹配,則它們有著相同的身份變量h1[910]。同樣地,模型M2的測試語音xp與訓練語音x2相匹配,則它們就有著相同的身份變量h2。用下式計算數據在模型M1下的似然分:

  Pr(x1,2,p|M1)=Pr(x1,p|M1)Pr(x2|M2) (6)

  其中隨機變量x1,p和x2是相互獨立的。此處目標是求出觀測數據的似然分,然而隱藏變量h和w都是未知的[1011]。提取出所有關鍵的觀測似然分和已知的隱藏變量,忽略未知的隱藏變量,從而可以得到:

  Pr(x1,p|M1)=Pr(x1,xp,h1,w1,wp)dh1dw1dwp(7)

  進一步可以得到:

  Pr(x1,p|M1)=∫[∫Pr(x1|h1,w1)Pr(w1)dw1

  ∫Pr(xp|h1,wp)Pr(wp)dwp]Pr(h1)dh1(8)

  同樣地,可以得出關于x2的條件概率:

  Pr(x2|M1)=Pr(x2|h2,w2)Pr(w2)dw2Pr(h2)dh2(9)

  以上條件概率所描述的都是最開始所定義的高斯分布,即式(1)~式(4)。同樣地,模型M2可以用相同的方法做分解。

  在計算式(8)、式(9)的積分時,算出N條語音匹配相同參數h的似然分,同時忽略了噪音參數w1...wN,加之PLDA是一種線性的高斯分布,所以可以將N條語音識別的系統按照式(1)寫成下面的等式:

  5.png

  將上式重新命名為:

  x′=μ′+Ay+′(11)

  Pr(x′|y)=x′[Ay,∑′](12)

  Pr(y)=y[0,I](13)

  其中:

  14.png

  式(12)、式(13)即為標準的因素分析形式,而這種方法是已知的:

  15.png

  實際中,在已知矩陣A結構的前提下,可以提高計算效率。

3實驗

  實驗采用GMM-UBM與PLDA進行比較。兩種算法均采用采樣率為16 kHz的語音和39維的MFCC特征,MFCC特征由基本的13維MFCC特征加上其一階導數和二階導數組成。其中MFCC的幀寬為24 ms,幀移為12 ms,預加重系數為0.97,MFCC濾波器組數目為30,低頻截止頻率為60 Hz,高頻截止頻率為3 600 Hz,DCT數目為16。同時增加有效語音檢測(Voice Activity Detection, VAD),取得有效音。對連續四周的語音進行測試,以等錯誤率(Equal Error Rate, EER)為判別標準。EER為錯誤拒絕率(False Rejection Rate,FRR)和錯誤接受率(False Acceptance Rate,FAR)相等的點。實驗結果如表1。 

004.jpg

  其中本周測試表示以當前周的訓練語音建立模型,用當前周的測試語音進行測試。第一周的結果表示的是以當前周的語音為訓練語音,以當前周的下一周的測試語音進行測試。后三周的測試方法與第一周的測試方法相同。

  由表1實驗結果可以看出,說話人識別的時變魯棒性具有線性變化規律,隨著時間的推移,不論是GMMUBM[12]還是PLDA[13],在不同周的測試效果均在逐步降低,但是PLDA的整體效果均優于GMMUBM。從時變的魯棒性來看,PLDA的EER從第一周到第四周表現比較平穩,均保持在9%左右,而GMM_UBM在第三周開始有了明顯的增加,也就是說GMMUBM的魯棒性有所降低。

4結束語

  本文通過使用PLDA模型對說話人識別進行了測試,目的在于解決時變的魯棒性問題,從實驗結果來看,PLDA對時變的魯棒性有很大的提高。本文中使用PLDA和GMMUBM對語音進行了測試,以GMMUBM為基線,從測試結果來看,PLDA的整體效果均優于GMMUBM。以后可以使用PLDA為基線,通過對PLDA的改進來進一步提高時變的魯棒性。

參考文獻

  [1] YOUNG S. A review of largevocabulary continuousspeech recognition[J]. Signal Processing Magazine, IEEE, 1996, 13(5): 45.

  [2] LIANG L, RENALS S. Probabilistic linear discriminant analysis for acoustic modelling[J]. IEEE Signal Processing Letters, 2014,21(6):702706.

  [3] CHEN L F, LIAO H Y M, LIN J C, et al. A new LDA-based face recognition system which can solve the sample size problem[J]. Pattern Recognition, 2000, 33(10): 17131726.

  [4] RUBIN R, THAYER D. EM algorithms for ML factor analysis[J]. Psychometrika, 1982,47(1):6976.

  [5] GHARAMANI Z, HINTON G E. The EM algorithm for mixtures of factor analyzers[R]. University of Toronto Technical Report, 1997.

  [6] DEHAK N, KENNY P J, DEHAK R, et al. Frontend factor analysis for speaker verification[J]. IEEE Transactions on Audio, Speech, and Language Processing, 2011, 9(4): 788798.

  [7] KIM T, KITTLER J. Locally linear discriminant analysis for multimodally distributed classes for face recognition with a single model image[J]. PAMI, 2005, 27(3): 318327.

  [8] MATEJKA P, GLEMBEK O, CASTALDO F, et al. Fullcovariance UBM and heavytailed PLDA in i-vector speaker verification[C]. In Proc. ICASSP. IEEE, 2011: 48284831.

  [9] HASAN T, HANSEN J H L. Acoustic factor analysis for robust speaker verification[J]. IEEE Transactions on Audio, Speech, and Language Processing, 2013, 21(4): 842853.

  [10] KENNY P. Bayesian speaker verification with heavy tailed priors[C]. In Speaker and Language Recognition Workshop (IEEE Odyssey), 2010:141.

  [11] GODFREY J J, HOLLIMAN E C, MCDANIEL J. SWITCHBOARD: telephone speech corpus for research and development[C]. In Proc. ICASSP. IEEE, 1992: 517520.

  [12] REYNOLDS D A, QUATERI T F, DUNN R B. Speaker verification using adapted Gaussian mixture models[J]. Digital Signal Processing, 2000, 10(1/3): 1941.


此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
国产欧美va欧美va香蕉在| 亚洲高清不卡av| 欧美国产一区二区| 久久伊人精品天天| 久久精品99无色码中文字幕| 午夜天堂精品久久久久| 亚洲午夜一二三区视频| 一本色道久久综合亚洲精品不卡| 亚洲人成毛片在线播放| 亚洲精品国偷自产在线99热| 亚洲国产三级网| 亚洲国产人成综合网站| 亚洲激情小视频| 亚洲人久久久| 99精品国产高清一区二区| 亚洲美女视频| 一片黄亚洲嫩模| 亚洲午夜一区| 午夜精品视频在线观看| 欧美一进一出视频| 久久成人人人人精品欧| 久久精品论坛| 另类综合日韩欧美亚洲| 欧美成人免费在线| 欧美日韩久久精品| 国产精品高潮在线| 国产伦一区二区三区色一情| 国产亚洲一本大道中文在线| 狠狠色综合色综合网络| 亚洲国产视频直播| 在线亚洲一区二区| 亚洲午夜黄色| 欧美一区亚洲二区| 亚洲精品孕妇| 亚洲综合精品自拍| 久久久久久亚洲精品中文字幕 | 亚洲精品在线观看视频| 999亚洲国产精| 亚洲伊人久久综合| 亚洲国产合集| 中文国产成人精品| 久久国产精品久久久久久| 久久中文字幕一区二区三区| 欧美精品三区| 国产精品一区二区你懂得| 狠狠干狠狠久久| 99成人在线| 欧美伊人久久| 在线亚洲免费| 久久精品国产77777蜜臀| 欧美肥婆在线| 国产精品日韩在线观看| 黄色亚洲大片免费在线观看| 亚洲精品社区| 性伦欧美刺激片在线观看| 亚洲伦理久久| 欧美一区免费| 欧美精品在线观看| 国产香蕉97碰碰久久人人| 亚洲高清资源综合久久精品| 亚洲一区二区三区777| 久久黄色级2电影| 亚洲视频免费在线观看| 久久裸体艺术| 国产精品国产三级国产专播品爱网| 狠狠噜噜久久| 亚洲深爱激情| 亚洲精品社区| 欧美在线观看你懂的| 欧美日本免费| 韩国亚洲精品| 亚洲一区精品在线| 亚洲精选久久| 久久天堂av综合合色| 欧美亚一区二区| 亚洲高清电影| 欧美一区二区三区婷婷月色 | 亚洲图片欧美午夜| 美女视频一区免费观看| 国产精品专区第二| 亚洲久久在线| 亚洲激情视频在线观看| 久久er99精品| 国产精品久久久久9999| 最新成人av在线| 久久精品视频播放| 欧美一区二区在线视频| 欧美三级欧美一级| 亚洲第一色在线| 久久精品视频一| 欧美中文在线免费| 国产精品免费观看视频| 亚洲毛片在线免费观看| 亚洲区一区二| 久久综合色8888| 国产综合网站| 亚洲欧美精品| 午夜在线观看免费一区| 欧美午夜激情在线| 亚洲精品少妇30p| 日韩亚洲欧美成人| 欧美成人xxx| 尤物精品在线| 亚洲高清视频在线| 久久久亚洲综合| 国产一区欧美| 久久av免费一区| 久久精品中文字幕免费mv| 国产精品自在线| 亚洲欧美视频在线观看视频| 亚洲欧美日韩中文在线制服| 欧美日韩综合在线| 日韩视频在线一区| 一本一本久久a久久精品牛牛影视| 欧美成人精品在线| 亚洲国产精品激情在线观看| 亚洲人成小说网站色在线| 免费成人av在线看| 在线观看视频一区| 亚洲精品国产品国语在线app| 免费久久99精品国产| 亚洲国产91| 日韩视频在线你懂得| 欧美日韩成人精品| 一区二区三区日韩欧美| 亚洲主播在线观看| 国产精品一区二区你懂得| 亚洲欧美日韩国产另类专区| 久久xxxx精品视频| 国产主播精品在线| 亚洲国产裸拍裸体视频在线观看乱了 | 中日韩男男gay无套| 欧美色精品天天在线观看视频 | 欧美综合国产精品久久丁香| 国产日韩精品视频一区| 欧美在线免费观看亚洲| 久久综合综合久久综合| 亚洲福利在线视频| 亚洲视频在线看| 国产精品蜜臀在线观看| 欧美一区二区三区免费视频| 久久久综合网站| 亚洲欧洲一区二区三区在线观看| 一区二区成人精品 | 亚洲日本aⅴ片在线观看香蕉| 欧美激情综合| 亚洲香蕉网站| 久久久999| 亚洲大片在线| 亚洲午夜国产成人av电影男同| 国产精品免费网站在线观看| 香蕉久久国产| 欧美国产一区二区| 中文精品视频| 久久久99免费视频| 亚洲人成免费| 欧美一级艳片视频免费观看| 韩日欧美一区| 在线视频日本亚洲性| 国产欧美日韩亚洲| 亚洲欧洲在线看| 国产精品激情偷乱一区二区∴| 欧美中文在线观看国产| 欧美日韩123| 亚洲欧美激情诱惑| 欧美成人精品一区二区三区| 一区二区三区视频在线看| 久久久水蜜桃| 亚洲九九爱视频| 久久久久国产免费免费| 亚洲精品一区二区三区四区高清| 欧美一区二区免费视频| 亚洲国产精品va| 午夜一区二区三区不卡视频| 一区在线影院| 午夜亚洲福利| 亚洲精品欧美| 久久久欧美一区二区| 日韩视频一区二区三区在线播放免费观看 | 亚洲激情在线观看视频免费| 欧美视频一区二区| 亚洲国产一二三| 国产精品一级二级三级| 亚洲六月丁香色婷婷综合久久| 国产欧美1区2区3区| 夜久久久久久| 伊人色综合久久天天| 西西人体一区二区| 亚洲黄色成人久久久| 久久精品国产69国产精品亚洲| 日韩午夜激情av| 玖玖精品视频| 亚洲免费影视| 欧美日韩综合另类| 亚洲激情社区| 国产一区二区三区自拍| 亚洲一区高清| 亚洲免费精彩视频| 欧美夫妇交换俱乐部在线观看| 欧美影院成人|