《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 設計應用 > 基于ARIMA-LSSVM混合模型的犯罪時間序列預測
基于ARIMA-LSSVM混合模型的犯罪時間序列預測
2015年電子技術應用第2期
涂小萌,陳強國
武漢大學 計算機學院 國家多媒體軟件工程研究中心,湖北 武漢430072
摘要: 對犯罪時間序列的預測對幫助公安部門更好地掌握犯罪動態,實現智能犯罪發現具有重大意義。針對犯罪時間序列預測的計算需求,結合真實犯罪數據集,提出了ARIMA-LSSVM混合模型。該模型通過ARIMA預測出時間序列的線性部分,通過PSO優化的LSSVM模型預測非線性部分,以對序列進行充分擬合,最后通過混合算法計算最終結果。使用此混合模型達到了精準的預測效果,證明了模型的有效性。
中圖分類號: P391;D917.9
文獻標識碼: A
文章編號: 0258-7998(2015)02-0160-03
A hybrid ARIMA-LSSVM model for crime time series forecast
Tu Xiaomeng,Chen Qiangguo
National Engineering Research Center for Multimedia Software, Computer School,Wuhan University,Wuhan 430072,China
Abstract: Forecasting the time series of crime can help public security department better grasp the criminal dynamic and has a great significance in realizing intelligent crime detection. Specific to the computing need of the prediction of crime time series, combining real crime dataset, a hybrid ARIMA-LSSVM model is put forward. This model utilizes ARIMA model predicting the linear component of series and PSO optimized LSSVM model predicting the nonlinear component to fully fitting the series, and computes the final result by using the hybrid algorithm. The great efficiency and accuracy are reached, which proves the validity of the model.
Key words : crime time series;phase space reconstruction(PSR);autoregressive integrated moving average(ARIMA);back propagation neural network(BP);PSO-LSSVM

  

0 引言

  高復雜度、樣本數據規模的持續增長是時間序列的兩大特點[1]。時間序列預測算法是從傳統的以ARIMA模型為核心的線性預測算法發展到以機器學習算法為核心的非線性預測算法。線性預測算法能夠以較低的計算復雜度獲得較為理想的運算結果,非線性預測算法能夠很好地逼近任意復雜度的非線性函數。而組合預測算法針對同一時間序列,結合線性和非線性模型的優點,可以獲得更佳預測效果。

  組合預測方法由J.M.Bates和C.WJ.Granger在1969年首次提出,并廣泛應用于各個領域。如ARIMA模型和SVM算法的組合在預測股票走勢時,預測精度與單一模型相比有明顯提高[2]。利用粒子群算法優化的BP神經網絡的學習算法,結合ARIMA和GM灰色預測的三個模型的組合預測也證明了其有效性與精確性[3-4]。ARIMA和BP的組合方案被應用于海洋流速、城市交通客流量的預測中[5-6]。

  時間序列預測屬于對時間序列規律的總結歸納,是犯罪數據挖掘的重要應用之一[7-8]。在犯罪預測領域,國內外學者進行了一系列研究。如對犯罪預測的研究方法的探索[9];通過相空間重構針對時間序列進行重構,并使用基于粒子群(Particle Swarm Optimized,PSO)優化的最小二乘支持向量機LSSVM建立犯罪趨勢預測模型[10];使用SVD算法對犯罪時間序列進行分解及預測[11]等,但單一模型預測的精度還有待改善。基于此,如何對犯罪時間序列進行精確和高效的預測成為一個重要的研究課題。本文提出的混合模型利用ARIMA、LSSVM和組合預測法的優勢,對微軟公共犯罪數據集進行建模與預測。通過仿真實驗得出結論,ARIMA-LSSVM混合模型與常用的ARIMA-BP混合模型相比,預測精確度有明顯提高。

1 時間序列預處理-相空間重構

  對于高維時間序列數據,在建模之前需對序列預先進行相空間重構PSR處理。

  首先對長度為N的原始時間序列Xt={x1,x2,…,xN}進行處理,得到延遲序列Y(t):

  1.png

  其中,?子稱為延遲算子或采樣算子,m稱為嵌入的維度。

  然后建立Y(t)到Y(t+T)的映射函數關系:

  YF(t+T)=f(Y(t))+et(2)

  其中,Y(t)為原始序列,YF(t+T)為預測序列,et為典型噪聲因子。

  由式(2)可得:

  3.png

  因此預測結果可以表示為:

  4.png

  其中,x為t+T+(m-1)子時刻時間序列的取值。由式(3)和式(4)可知,YF(t+T)中包含主要預測結果。

  2 ARIMA模型

  ARIMA(Autoregressive Integrated Moving Average Model)模型表達式為ARIMA(p,d,q)。其中d代表差分次數,p和q分別代表自回歸和移動平均系數。

  模型定義如下:

  5.png

  引入延遲算子(B):

  6.png

  模型簡化為:

  7.png

  若xt為非平穩序列,通過差分得到平穩序列zt:

  8.png

  其中,d為差分次數。

  3 LSSVM模型

  最小二乘支持向量機LSSVM 是結構最小化風險函數為二次損失函數的支持向量機。

  支持向量機分類器的表達式為:

  9.png

  其中,k=1,…,N;?棕為權重值,b為結構風險規則。xk為輸入模式,yk為輸出。?準為將輸入數據映射到高維特征空間的非線性映射。?著k為誤差變量。

  對于最小二乘支持向量機,基于結構風險最小化原則,優化問題為:

  10.png

  其中,?酌>0,為正則化參數。

  根據Karush-Kuhn-Tucker(KKT)條件和Mercer條件,LSSVM的優化問題轉化為求解線性方程,最后得到方程:

  11.png

  LSSVM的核函數徑向基RBF核:

  12.png

  其中,?滓為核寬度。RBF內核適用于大多數預測問題,且效率高,處理速度快。使用粒子群優化算法PSO優化的LSSVM比傳統LSSVM具有更好的分類效果[12]。

  4 ARIMA-LSSVM混合模型

  混合模型包括一個線性模型和一個或多個非線性模型。混合模型Zt可以表示為:

  Ht=Lt+Nt(13)

  其中,Lt和Nt分別為混合模型的線性和非線性成分。

  首先由線性模型ARIMA得出序列預測值t,與原序列值相減計算得到預測殘差?著t:

  14.png

  然后用非線性模型LSSVM對殘差序列進行建模:

  15.png

  其中,f(·)為非線性函數,?著t-n為t-n時刻的殘差,?駐t為隨機誤差。

  最后,殘差序列經過非線性模型修正后得到t,相加得到最終結果:

  16.png

  Granger的實驗證明混合模型要取得最優預測效果,成員模型應該是次優的[13]。ARIMA模型在短期預測中預測誤差較小[14],混合模型首先利用ARIMA獲取較為精確的預測序列,與原序列相減得到殘差序列。殘差序列對應于ARIMA無法解釋的非線性規律,然后使用LSSVM模型對非線性部分進行建模與預測。最后將兩部分的結果相加得到混合模型最終預測結果。算法框架圖如圖1所示。

001.jpg

  5 實驗

  5.1 數據集

  實驗數據集為1993年~2009年美國警方記錄在案的犯罪數據[15],實驗環境為SPSS16.0和MatlabR2011a。

  5.2 預測模型的評判標準

  使用如下統計量檢驗模型的擬合效果和預測效果:

  1718.png

  其中,Zt、t分別為真實值和預測值。MSE和MAPE分別為均方誤差和平均絕對百分比誤差。n為預測樣本個數。eMSE和eMAPE值越小,表明模型的預測精度越高。

  5.3 預測模型的參數選擇

  ARIMA模型的參數根據自相關函數圖ACF和偏自相關函數圖PACF進行選擇。LSSVM模型使用RBF核函數和二維柵格搜索方法尋找最優核參數。BP神經網絡結構設置為3-10-5-1。

  5.4 實驗方案

  首先對模型ARIMA、GM、BP、LSSVM進行時間序列建模,計算其預測誤差,結果見表1。

003.jpg

  結果表明,ARIMA、BP、LSSVM 3種算法的誤差較小。綜合建模和預測效果,選取ARIMA、LSSVM、BP作為對比模型。

002.jpg

  然后使用本文提出的 ARIMA-LSSVM 混合模型進行預測,預測的結果對比如圖2所示。橫坐標表示時間序列的序列號K,縱坐標表示對應時刻的犯罪數據。K=12,13,14時曲線對應于2007~2009年的預測值。算法預測參數對比見表2。

004.jpg

  實驗結果表明,ARIMA-LSSVM對犯罪時間序列的預測誤差 MAPE遠小于其他預測模型,預測準確度也較高。由于單一的線性模型或者非線性模型預測具有不穩定性,而本文選取的模型充分考慮了時間序列的平穩和非平穩性,使預測容納更多隱含信息,結合模型的優勢,大大提高了預測的穩定性和精確性,預測的結果更有實際意義。

6 結論

  本文使用ARIMA-LSSVM混合模型對犯罪時間序列進行組合預測,結果表明與ARIMA-BP混合模型相比, 該模型對小樣本的犯罪時間序列具有更高的預測精度和有效性。本文屬于針對時間信息的歸納與推測,而結合空間信息和時間信息的時空分析與預測更能體現犯罪數據之間的緊密聯系,分析結果包含更多信息,是未來進一步的研究方向。

  參考文獻

  [1] 何書元.應用時間序列分析[M].北京:北京大學出版社,2004:185-229.

  [2] Pai Pingfeng,Lin Chih-Sheng.A hybrid ARIMA and supportvector machines model in stock price forecasting[J].Omega,2005,33(6):497-505.

  [3] 崔吉峰,乞建勛,楊尚東.基于粒子群改進BP神經網絡的組合預測模型及其應用[J].中南大學學報:自然科學版,2009,40(1):190-194.

  [4] 單銳,王淑花,李玲玲,等.基于ARIMA,BP神經網絡與GM的組合模型[J].遼寧工程技術大學學報:自然科學版,2012,31(1):118-122.

  [5] 董世超.基于ARIMA-BP神經網絡模型海流流速預測研究[J].中國科技信息,2014(2):86-88.

  [6] 劉杰.城市交通樞紐短期客流量的組合預測模型[J].交通信息與安全,2014(2):41-44.

  [7] Fu Tak-chung.A review on time series data mining[C].Engineering Applications of Artificial Intelligence,2011,24(1):164-181.

  [8] Yu Chung-Hsien.Crime forecasting using data mining techniques[C].Data Mining Workshops(ICDMW),2011 IEEE11th International Conference on.IEEE,2011:779-786.

  [9] 黃超,李繼紅.犯罪預測的方法[J].江蘇警官學院學報,2011,26(1):107-110.

  [10] 王少軍.時間序列預測的可重構計算研究[D].哈爾濱:哈爾濱工業大學, 2012.

  [11] JIANG Q,BARRICARTE J J S.A crime rate forecast and decomposition method[J].International Journal of Crimino-logy and Sociological Theory,2011,4(2):648-656.

  [12] ALWEE R,SHAMSUDDIN S M,SALLEHUDDIN R.Hybrid support vector regression and autoregressive integ-rated moving average models improved by particle swarm optimization for property crime rates forecasting with economic indicators[J].The Scientific World Journal,2013(1):951475.

  [13] Yearly time series(1993-2012),provided by Eurostat(website)[DB/CD].https://datamarket.com/data/set/1c05/crimes-recorded-by-the-police#!ds=1c05!vwx=6:6fwj=3.6.a.11.19&display=l.

  [14] 陳昌和,李清海,張衍國,等.爐排-循環床復合垃圾焚燒爐燃燒過程模型[J].清華大學學報(自然科學版),2008,48(5):832-835.

  [15] Yang Xiaoguang.An empirical study on stock price based on ARIMA model[C].International Conference on LogisticsEngineering,Management and Computer Science,LEMCS,2014:273-276.


此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 色老成人精品视频在线观看| 亚洲免费在线视频播放| 青青热久久久久综合精品 | 在线视频一区二区三区四区| 两个人看的www高清免费视频| 日本娇小xxxⅹhd成人用品| 亚洲av无码不卡一区二区三区| 欧美高清熟妇啪啪内射不卡自拍| 免费在线观看a视频| 美女尿口18以下禁止观看免费| 国产人va在线| 香蕉精品视频在线观看| 国产无遮挡又黄又爽又色| 深夜福利视频网站| 国产美女极度色诱视频www| 99re热这里只有精品| 天堂成人在线观看| www成人免费观看网站| 怡红院国产免费| 中国老人倣爱视频| 成年人在线免费观看视频网站| 久久se精品一区二区| 日本乱子伦xxxx| 久久久精品2019中文字幕2020 | 黑森林av福利网站| 国产真实乱偷人视频| 色狠台湾色综合网站| 国产精品嫩草影院永久一| 一区二区三区免费视频播放器| 拍拍拍无挡视频免费观看1000| 亚洲一成人毛片| 欧美性69式xxxx护士| 人妻巨大乳hd免费看| 男朋友说我要冲你是什么意思| 免费超爽大片黄| 精品久久久无码人妻中文字幕豆芽 | 夫妇野外交换hd中文小说| v11av82| 妞干网免费观看视频| 久久精品99国产精品日本| 欧美激情综合色综合啪啪五月|