《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > 基于TF-IDF進化集成分類器的鐵路安全故障文本分類
基于TF-IDF進化集成分類器的鐵路安全故障文本分類
2021年電子技術應用第4期
高 凡1,王富章1,張 銘1,趙俊華2,李高科1
1.中國鐵道科學研究院,北京100081;2.北京經緯信息技術有限公司,北京100081
摘要: 鐵路安全問題是鐵路運輸保證的核心問題,鐵路安全問題非結構化文本數據量大,文本內容無特定規律,對于綜合分析解決安全故障問題造成很高的難度。針對鐵路安全問題數據智能分類,提出進化集成分類器模型。運用TF-IDF算法,通過分析接觸網安全問題的數據特點提取文本特征。采用決策樹作為基分類器的Bagging集成分類器將文本數據分類,在Bagging分類過程中,針對Bagging算法產生的基分類器組合解集,提出采用遺傳算法(Genetic Algorithm)將其優化,產生分類結果較優的基分類器組合解集。以鐵路局實際安全問題進行實驗分析,實驗證明TF-IDF+Bagging+Genetic Algorithm=Evolutionary Ensemble Classifier進化集成分類器模型在鐵路安全問題文本分類中具有較高的準確性。
中圖分類號: TN02;U284
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.200284
中文引用格式: 高凡,王富章,張銘,等. 基于TF-IDF進化集成分類器的鐵路安全故障文本分類[J].電子技術應用,2021,47(4):71-76,81.
英文引用格式: Gao Fan,Wang Fuzhang,Zhang Ming,et al. Text classification of railway safety fault based on TF-IDF evolutionary integrated classifier[J]. Application of Electronic Technique,2021,47(4):71-76,81.
Text classification of railway safety fault based on TF-IDF evolutionary integrated classifier
Gao Fan1,Wang Fuzhang1,Zhang Ming1,Zhao Junhua2,Li Gaoke1
1.China Academy of Railway Science,Beijing 100081,China; 2.Beijing Jingwei Information Technologies Co.,Ltd.,Beijing 100081,China
Abstract: Railway safety is the core of railway transportation guarantee. The unstructured text data of railway safety problems is large, and the content of the text has no specific rules, which makes it very difficult to comprehensively analyze and solve the safety problems. Aiming at the intelligent classification of railway safety data, an evolutionary ensemble classifier model is proposed. By analyzing the characteristics of the catenary security issues of data, TF-IDF model is adopted to realize the feature extraction. Bagging ensemble classifier which uses Decision Tree as the base classifier classifies the text data, in the process of classification of Bagging, for the combined solution set of base classifier generated by Bagging Algorithm, Genetic Algorithm is proposed to optimize it to generate the combined solution set of base classifier with better classification results. Based on the safety problem of power supply contact network of a railway bureau, the experimental analysis shows that the TF-IDF+Bagging+Genetic Algorithm=Evolutionary Ensemble Classifier model has a high classification index in the text classification of railway safety problems.
Key words : software railway safety problems;TF-IDF;base classifier;integrated classifier;evolutionary integration classifier

0 引言

    安全問題歷來是鐵路運輸的重點關注問題,在鐵路安全監控體系中,為減少運營過程中可能存在的安全隱患,減少設備故障,保障系統穩定運行,安全人員根據日常巡檢、專項巡檢、重大節假日排查等計劃定期到現場檢查存在的安全生產故障隱患,并將問題記錄為文本形式存儲。管理人員依據這些問題記錄,分析、總結與整改問題。在長期形成的海量的安全問題文本文件中,采用文本分類技術將安全問題自動歸類,輔助管理人員更好地掌握與處理安全問題,在鐵路安全領域的重要性日漸凸顯。

    一般來說,文本分類過程有以下3個步驟[1]:預處理、文本表示和文本分類。其中,文本預處理包括分詞、去除停頓詞、去除不規則數據等。文本表示即將提取的文本特征轉換為計算機可處理的數據類型(通常用向量表示)。文本表示方法包括詞袋模型(BOW)、詞頻-逆向文件頻率(Term Frequency-Inverse Document Frequency,TF-IDF),以及基于深度學習的Word2vec表示方法等[2]。在構造分類器時使用的技術大體包括單個的基分類器集成分類器以及深度學習模型[3]。集成分類器主要包含Bagging和Boosting兩種,Bagging的主要算法是隨機森林,Boosting的主要算法是梯度提升樹。在深度學習領域,有基于深度信念網絡、卷積神經網絡[4-5]、循環神經網絡等完成文本分類任務[6]

    目前,國內學者在鐵路文本分析領域研究較多。王廣采用貝葉斯網絡的預測模型和自適應增強算法(Adaptive Boosting,AdaBoost)的預測模型實現天氣相關的鐵路道岔故障預測[7];趙陽等以故障文本信息為依據,針對高鐵信號車載設備,提出貝葉斯結構學習算法(HDBN_SL)[8];李佳奇等將面向Agent的分布式人工智能技術引入到信號設備故障診斷系統中[9];楊連報針對信號故障不平衡數據,采用SVM-SMOTE算法對TF-IDF轉換后的小類別文本向量數據隨機生成,分別采用基分類器和集成分類對數據進行分類[10]。本文處理安全問題為事故故障發生前人員檢查時發現的風險、隱患內容,通常包括安全問題發生的時間、地點、問題描述等關鍵要素[11],所以針對每一類安全問題,存在特定的關鍵詞,本文在文本特征抽取上采用TF-IDF表示,針對Bagging集成分類器的基礎上,采用遺傳算法優化,提升分類準確性[12]




本文詳細內容請下載:http://www.jysgc.com/resource/share/2000003467




作者信息:

高  凡1,王富章1,張  銘1,趙俊華2,李高科1

(1.中國鐵道科學研究院,北京100081;2.北京經緯信息技術有限公司,北京100081)

此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲欧美日韩一区二区| 欧美v日韩v国产v| 亚洲高清av| 亚洲欧美日韩一区二区三区在线观看 | 国产精品午夜在线| 欧美日韩免费一区二区三区| 米奇777在线欧美播放| 久久精品官网| 欧美在线视频全部完| 亚洲欧美99| 亚洲一区图片| 亚洲一区国产精品| 亚洲一区免费视频| 亚洲影音一区| 亚洲永久免费精品| 亚洲在线成人精品| 亚洲一区二区在| 亚洲午夜女主播在线直播| 99综合精品| 99国产精品99久久久久久粉嫩| 亚洲精品一区二区三区在线观看| 亚洲国产欧美不卡在线观看| 91久久精品国产91性色| 最新日韩精品| 亚洲精品中文字幕有码专区| av不卡在线| 亚洲午夜av在线| 午夜国产精品影院在线观看 | 欧美精品xxxxbbbb| 欧美国产视频一区二区| 欧美精品在线免费播放| 欧美日韩在线高清| 国产精品成人播放| 国产精品视频导航| 国产亚洲一二三区| 亚洲成色777777在线观看影院 | 一区二区三区在线视频播放| 一区二区亚洲欧洲国产日韩| 亚洲激情成人| 一区二区欧美激情| 欧美一级视频免费在线观看| 亚洲成人在线视频播放 | 夜夜精品视频| 亚洲视频图片小说| 香蕉成人伊视频在线观看| 性欧美大战久久久久久久久| 亚洲国产精品va在看黑人| 最新国产拍偷乱拍精品| 亚洲视频国产视频| 香蕉久久夜色精品国产使用方法 | 久久久久国产精品厨房| 牛牛影视久久网| 欧美日韩亚洲视频一区| 国产欧美精品va在线观看| 亚洲大片av| 一区二区三欧美| 久久精品女人天堂| 夜夜夜精品看看| 欧美在线视频免费| 欧美激情第一页xxx| 国产精品每日更新| 伊人婷婷欧美激情| 一本色道久久99精品综合| 午夜精品www| 亚洲美女在线国产| 欧美一区影院| 欧美激情国产日韩精品一区18| 国产精品久久久久久模特| 国产精品久久999| 亚洲成人在线视频播放| 亚洲尤物视频在线| 亚洲精品久久久久久久久| 亚洲欧美日韩一区二区在线| 久久久久久久国产| 欧美天堂亚洲电影院在线观看| 国产三级欧美三级| 亚洲精品日韩久久| 久久se精品一区精品二区| 在线视频精品一| 久久久人成影片一区二区三区| 欧美日韩免费在线| 狠狠色综合一区二区| 99精品国产99久久久久久福利| 久久精品国产99| 亚洲欧美综合精品久久成人 | 国产精品视频九色porn| 亚洲日本欧美| 久久精品人人爽| 午夜精品久久久久久久久| 欧美精品一区二区三区蜜臀| 韩日成人av| 在线一区二区三区做爰视频网站| 亚洲高清一区二| 欧美一区二区精品在线| 欧美日韩中文字幕日韩欧美| 影音先锋久久| 欧美一级在线播放| 亚洲欧美日韩综合一区| 欧美日韩国产综合一区二区| 一区二区三区无毛| 欧美中文字幕在线| 欧美亚洲一级片| 欧美日韩在线视频一区| 亚洲精品免费一二三区| 亚洲国产日韩欧美| 久久国产精品久久久久久久久久| 欧美亚洲不卡| 亚洲美女性视频| 亚洲理伦电影| 欧美jizz19性欧美| 伊人婷婷欧美激情| 亚洲高清视频中文字幕| 久久久久久久成人| 国产一区二区三区在线观看精品 | 欧美另类69精品久久久久9999| 伊人久久久大香线蕉综合直播| 欧美一级专区| 久久国产夜色精品鲁鲁99| 国产女人精品视频| 亚洲欧美日韩国产一区二区| 亚洲欧美制服另类日韩| 欧美性大战久久久久久久| 日韩亚洲欧美综合| 这里只有精品视频| 欧美性猛交视频| 日韩视频免费看| 亚洲午夜电影在线观看| 欧美视频日韩视频在线观看| 一本色道久久综合亚洲精品高清| 在线一区二区视频| 欧美日韩综合视频| 中文在线资源观看网站视频免费不卡 | 亚洲精品日产精品乱码不卡| 欧美激情2020午夜免费观看| 亚洲精品视频一区二区三区| 99精品欧美一区二区三区| 欧美日韩成人在线观看| 在线一区二区日韩| 欧美一区二区三区四区在线| 国产日韩一区| 亚洲第一精品电影| 欧美二区在线观看| 亚洲美女毛片| 亚洲欧美日韩精品久久奇米色影视| 国产精品美女久久| 欧美一级在线播放| 美女在线一区二区| 亚洲欧洲在线免费| 亚洲视频在线观看三级| 国产精品久久久久久模特| 性欧美精品高清| 另类人畜视频在线| 亚洲日本va午夜在线影院| 亚洲午夜在线视频| 国产日本欧美一区二区三区在线| 久久精品九九| 欧美国产视频日韩| 亚洲一区中文| 久久影院亚洲| 亚洲伦理精品| 在线一区二区视频| 亚洲欧美日韩视频二区| 欧美诱惑福利视频| 一区精品在线播放| 一本久道久久综合中文字幕| 国产精品日韩电影| 亚洲国产99| 欧美色图麻豆| 午夜在线精品| 欧美极品aⅴ影院| 亚洲一区二区三区精品在线| 久久在线免费视频| 亚洲精品一区在线| 欧美一区二区三区播放老司机| 国内成人精品视频| 在线中文字幕不卡| 国产一区二区毛片| 99精品国产热久久91蜜凸| 国产欧美精品久久| 日韩视频在线观看一区二区| 国产麻豆91精品| 亚洲人成欧美中文字幕| 国产精品区免费视频| 亚洲国产日韩欧美一区二区三区| 欧美日韩中文另类| 久久福利一区| 欧美性开放视频| 亚洲三级影院| 国产欧美视频一区二区| 日韩视频中文字幕| 国产在线播放一区二区三区| 一区二区三区精品| 国产在线乱码一区二区三区| 亚洲私人影院| 亚洲缚视频在线观看| 久久精品国产第一区二区三区| 亚洲免费观看高清在线观看 | 国产亚洲欧洲一区高清在线观看 | 亚洲私人影吧| 欧美成人免费在线视频|