《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 設計應用 > 一種基于DTW的符號化時間序列聚類算法
一種基于DTW的符號化時間序列聚類算法
來源:微型機與應用2011年第18期
李 迎
(遼寧師范大學 計算機與信息技術學院, 遼寧 大連 116081)
摘要: 提出了一種基于DTW的符號化時間序列聚類算法,對降維后得到的不等長符號時間序列進行聚類。該算法首先對時間序列進行降維處理,提取時間序列的關鍵點,并對其進行符號化;其次利用DTW方法進行相似度計算;最后利用Normal矩陣和FCM方法進行聚類分析。實驗結果表明,將DTW方法應用在關鍵點提取之后的符號化時間序列上,聚類結果的準確率有較好大提高。
Abstract:
Key words :

摘  要: 提出了一種基于DTW的符號化時間序列聚類算法,對降維后得到的不等長符號時間序列進行聚類。該算法首先對時間序列進行降維處理,提取時間序列的關鍵點,并對其進行符號化;其次利用DTW方法進行相似度計算;最后利用Normal矩陣FCM方法進行聚類分析。實驗結果表明,將DTW方法應用在關鍵點提取之后的符號化時間序列上,聚類結果的準確率有較好大提高。
關鍵詞: 時間序列;DTW;SAX;Normal矩陣;FCM

    時間序列(Time Series)挖掘是數(shù)據(jù)挖掘中的一個重要研究分支,有著廣泛的應用價值。近年來,時間序列挖掘在宏觀的經(jīng)濟預測、市場營銷、客流量分析、太陽黑子數(shù)、月降水量、河流流量、股票價格變動等眾多領域得到了廣泛應用[1]。
    時間序列的相似性是衡量兩個時間序列相似程度的一個重要指標,它是時間序列聚類、分類、異常發(fā)現(xiàn)等諸多數(shù)據(jù)挖掘的基礎,也是研究時間序列挖掘的核心問題之一[2]。歐氏距離(Euclidean)和動態(tài)時間彎曲距離(Dynamic Time Warping)是計算時間序列相似性時經(jīng)常被采用的兩種度量方式。歐氏距離對時間軸上的輕微變化非常敏感,一些輕微的變化可能使歐氏距離的變化很大,而動態(tài)時間彎曲距離可以有效地消除歐氏距離這個缺陷,動態(tài)時間彎曲可以廣泛應用在自然科學、醫(yī)學、企業(yè)和經(jīng)濟等方面[3]。SAX(Symbolic Aggregate Approximation)[4]是一種運用符號化方法對時間序列進行表示、維度約簡及相似性度量的方法。但SAX方法采用PAA算法將時間序列平均劃分,不能很好地計算序列之間的相似度。而利用均分點和關鍵點對序列進行分段,既考慮了序列本身概率分布的變化,又兼顧到序列形態(tài)的變化。
    本文提出一種基于DTW的符號化時間序列聚類算法,在提取關鍵點之后,再進行符號化時間序列,以達到降維的目的。降維之后得到的符號序列為不等長序列,采用動態(tài)時間彎曲距離(DTW)方法進行計算, 魯棒性好。然后通過DTW得到的距離矩陣構建復雜網(wǎng)絡,并尋找其社團結構,實現(xiàn)了符號時間序列聚類。本文用DTW方法進行相似性度量比KPDIST[4]在聚類結果的準確率上有較好大提高。
1 相關知識
1.1時間序列關鍵點的選取

  基于參考文獻[5]可知,時間序列中的極值點EP成為關鍵點KP的條件為:
  條件1. xi保持極值的時間段與該序列長度的比值必須大于某個閾值C;
  條件2. 若條件1不滿足,則包含xi的最小序列模式<xi-1,xi,xi+1>中, 三點連線形成的夾角小于篩選角度α0。

 


2.2 基于DTW的符號化聚類算法
    輸入:時間序列集。
    輸出:聚類結果。
    (1)對每個序列,運用上面的算法得到最終的關鍵點序列;
    (2)計算序列C在各區(qū)間[KPci,KPcj)內(nèi)的均值,并表示為符號序列;
    (3)對序列C和序列Q的符號序列進行相似性距離計算(DTW計算和KPDIST計算);
    (4)根據(jù)相似度,構建復雜網(wǎng)絡G;此處要給相似度賦予一個閾值,相似性小于閾值的點則認為無邊連接。
    (5)用Normal矩陣方法FCM算法對復雜網(wǎng)絡G進行社團劃分,得到聚類結果。
3 實驗結果與分析
    本文實驗采用Keogh博士的Synthetic Control和ECG數(shù)據(jù)集。實驗環(huán)境為2.66 GHz CPU Pentium@4 PC機, 1 GB內(nèi)存,操作系統(tǒng)為Windows XP Professional。算法實現(xiàn)軟環(huán)境為matlab 7.0和VC++6.0。Synthetic Control數(shù)據(jù)集的實驗數(shù)據(jù)為300條,每條時間序列長度為60。ECG數(shù)據(jù)集有100個樣本序列,每條時間序列長度為96(http://www.cs.ucr.edu/~eamonn/time_series_data/)。原時間序列維度為60和96,經(jīng)過關鍵點提取、符號化之后,維度大大降低,這為后期處理帶來了很大的方便。 在本實驗中,關鍵點提取時篩選角度為45°,預設的壓縮率為80%,劃分了4個區(qū)間段,用符號表示時為a,b,c,d四種字母。由于實驗數(shù)據(jù)的樣本個數(shù)很多,這里只顯示synthetic control的部分實驗結果。表1為降維后的前4個符號序列實驗結果。


    表2為Normal矩陣得到的非平凡特征值對應的非平凡特征向量,根據(jù)譜平分算法思想,同一社團內(nèi)的節(jié)點相應的元素xi非常接近。從特征向量的分析中可以看出,將DTW與復雜網(wǎng)絡知識應用在符號化時間序列上是一種較好的創(chuàng)新。

    由DTW距離矩陣得到的網(wǎng)絡中,第一非平凡特征值取值為:0.252 9,而通過KPDIST距離矩陣得到的復雜網(wǎng)絡中,第一非平凡特征值取值為:0.125 7,從特征值中就可以初步判斷,DTW得到的特征值更為準確,這兩個特征值對應的特征向量的區(qū)間表如表2所示。
    表3為兩種算法對同樣數(shù)據(jù)集進行聚類得到的結果。數(shù)據(jù)集Synthetic control采用本文方法正確率為76.3%。而利用KPDIST算法正確率為69%;數(shù)據(jù)集ECG,本文的正確率為72%,KPDIST的正確率為65%。


    SAX是一種符號化的時間序列相似性度量方法,該方法在對時間序列劃分時,采用了PAA算法的均值劃分,得出的結果不能精確地表示出原時間序列,故將關鍵點提取方法與PAA方法相結合,在對原序列降維的同時又能更準確地表示原時間序列。本文將復雜網(wǎng)絡知識和時間序列降維方法相結合,給出了一種時間序列的聚類方法。該算法用DTW算法計算時間序列間的相似度,而后從時間序列的相似度得到一個復雜網(wǎng)絡,此復雜網(wǎng)絡表示了時間序列相互間的關系。最后采用Normal矩陣的方法進行網(wǎng)絡劃分,得到一個網(wǎng)絡的社團結構。從這個社團結構中已能看出樣本時間序列的歸屬類別,但為了結果更加清晰,用具體數(shù)字來體現(xiàn),所以采用了FCM聚類算法進行最后的聚類。實驗結果表明,用DTW方法計算序列之間的相似度結合在降維后的符號化時間序列上比原文KPDIST方法在準確率上有較好大提高。
參考文獻
[1] 毛國君,段立娟,王實,等.數(shù)據(jù)挖掘原理與算法(第二版)[M].北京:清華大學出版社,2007.
[2] 劉懿,鮑德沛,楊澤紅.新型時間序列相似性度量方法研究[J].計算機應用研究,2007,24(5):112-114.
[3] KEOGH E, RATANAMAHATANA C A. Exact indexing of dynamic time warping[J]. Springer-Verlag London Ltd, 2005, 10.1007/s10115-004-0154-9:358-386.
[4] 閆秋艷,孟凡榮.一種基于關鍵點的SAX改進算法[J].計算機研究與發(fā)展,2009,46(z2):483-490.
[5] 杜奕.時間序列挖掘相關算法研究及應用[D].合肥:中國科學技術大學,2007.
[6] 汪小帆,李翔,陳關榮.復雜網(wǎng)絡理論及其應用[M].北京:清華大學出版社,2006:169-171.

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲欧美日韩国产一区二区三区 | 一区二区三区欧美在线| 国产欧美一区二区精品性色| 欧美日韩午夜激情| 欧美日本不卡高清| 欧美激情第8页| 欧美va亚洲va香蕉在线| 老鸭窝91久久精品色噜噜导演| 久久久久久**毛片大全| 久久精品二区| 久久久久国产精品www| 久久久久国产一区二区三区四区| 久久国产精品99久久久久久老狼| 欧美在线观看天堂一区二区三区 | 国产精品久久久久久久久婷婷| 欧美色视频日本高清在线观看| 欧美视频免费在线| 欧美亚男人的天堂| 欧美午夜宅男影院在线观看| 国产精品成人观看视频免费| 国产精品天天看| 国产欧美一区二区精品婷婷 | 国产一区亚洲一区| 国产一区二区三区四区三区四| 国产一区导航| 精品白丝av| 亚洲精品美女在线观看| 99国产精品99久久久久久粉嫩 | 亚洲网在线观看| 亚洲欧美一级二级三级| 欧美一区二区三区视频免费播放| 久久精品人人做人人爽电影蜜月| 亚洲黄一区二区三区| 亚洲精品综合| 亚洲一区二区3| 久久精品亚洲一区二区三区浴池| 老司机成人在线视频| 欧美精品九九| 国产精品乱码妇女bbbb| 国产美女精品视频| 一区二区视频欧美| 99国产精品久久| 欧美一区二区三区视频在线| 亚洲人永久免费| 亚洲在线视频| 久久偷窥视频| 欧美视频你懂的| 韩国成人福利片在线播放| 亚洲高清不卡在线观看| av成人免费观看| 欧美在线黄色| 一区二区免费在线视频| 欧美一区二区三区日韩| 蜜桃精品久久久久久久免费影院| 欧美日韩综合久久| 国内视频精品| 9久re热视频在线精品| 欧美怡红院视频一区二区三区| 亚洲欧洲精品一区二区三区不卡 | 亚洲美女视频在线观看| 亚洲欧美中文字幕| 欧美1级日本1级| 国产精品老女人精品视频| 影音先锋久久精品| 在线亚洲一区| 91久久午夜| 性色av香蕉一区二区| 欧美成人在线网站| 国产视频精品va久久久久久| 亚洲精品国产品国语在线app | 亚洲国产精品成人va在线观看| 在线亚洲欧美专区二区| 久久久久久久97| 国产精品sss| 亚洲激情成人在线| 欧美一区影院| 亚洲欧美日本伦理| 欧美福利电影网| 国产一区二区久久精品| 一本大道久久a久久精品综合| 久久精品青青大伊人av| 午夜日韩在线观看| 欧美日韩国语| 亚洲国产美国国产综合一区二区| 午夜欧美大尺度福利影院在线看| 一区二区激情小说| 欧美岛国激情| 国内精品久久久久久| 亚洲女ⅴideoshd黑人| 一区二区三区国产精品| 你懂的网址国产 欧美| 国产午夜精品理论片a级大结局 | 日韩网站在线| 另类综合日韩欧美亚洲| 国产日产欧产精品推荐色 | 欧美刺激午夜性久久久久久久| 国产欧美日韩一区| 亚洲午夜视频在线| 亚洲特黄一级片| 欧美日韩精品系列| 亚洲欧洲在线一区| 最新亚洲视频| 美女精品在线观看| 加勒比av一区二区| 欧美在线亚洲一区| 久久久精彩视频| 国产一区二区三区的电影 | 亚洲免费高清| 亚洲精选视频在线| 欧美成人自拍视频| 亚洲国产欧美一区| 亚洲国产精品一区二区第一页| 久久网站免费| 加勒比av一区二区| 亚洲国产成人av| 久久夜色精品国产噜噜av| 国产一区二区精品丝袜| 欧美一区二区视频观看视频| 久久精品人人做人人综合| 国产亚洲欧美aaaa| 久久精品99| 女同一区二区| 亚洲欧洲精品一区二区| 亚洲精品一区二区三区四区高清| 欧美多人爱爱视频网站| 最新国产拍偷乱拍精品| 一本久久a久久免费精品不卡| 欧美乱妇高清无乱码| 亚洲精品美女久久久久| 中文国产亚洲喷潮| 国产精品久久久久久五月尺| 亚洲欧美激情精品一区二区| 久久国产99| 精品二区久久| 日韩亚洲欧美一区二区三区| 欧美日韩黄色大片| 亚洲一区区二区| 久久精品视频va| 亚洲福利视频专区| 中文精品视频| 国产欧美日韩精品专区| 亚洲第一页在线| 欧美国产视频在线观看| 日韩视频专区| 欧美一区二区在线观看| 影音先锋在线一区| 一本色道久久精品| 国产精品视频一二三| 欧美在线观看网址综合| 欧美成人午夜激情在线| 在线亚洲激情| 久久免费国产精品1| 亚洲人成网站777色婷婷| 亚洲女人天堂av| 黑丝一区二区| 在线综合亚洲欧美在线视频| 国产精品美女www爽爽爽视频| 欧美在线观看网站| 欧美日韩国产va另类| 亚洲综合日韩| 美女视频黄 久久| 在线亚洲观看| 久久综合精品国产一区二区三区| 亚洲精品乱码久久久久久久久| 欧美一级欧美一级在线播放| 精品av久久久久电影| 亚洲午夜精品久久| 国产一区二区精品久久99| 99热在这里有精品免费| 国产欧美日韩综合一区在线观看 | 国产一区二区三区成人欧美日韩在线观看 | 亚洲视频在线观看三级| 久久免费视频网| 日韩写真在线| 久久人人97超碰精品888| 日韩视频免费| 久久久噜噜噜久久人人看| 亚洲理论在线| 久久美女性网| 亚洲小说欧美另类社区| 免费一级欧美片在线播放| 亚洲欧美电影院| 欧美日韩国产精品一区二区亚洲| 亚欧成人在线| 国产精品a久久久久久| 亚洲精品乱码久久久久久蜜桃91| 国产免费成人在线视频| 99成人在线| 激情综合激情| 欧美一区二区视频免费观看| 亚洲免费观看在线观看| 久久免费高清| 亚洲欧美在线视频观看| 欧美日韩免费一区二区三区视频| 亚洲第一网站| 国产亚洲欧美一区二区| 亚洲在线国产日韩欧美| 亚洲片在线观看| 免费亚洲婷婷| 亚洲第一天堂av|