《電子技術應用》
您所在的位置:首頁 > 人工智能 > 設計應用 > 基于交點的新層次聚類算法
基于交點的新層次聚類算法
2020年信息技術與網絡安全第10期
李青旭,陳天鷹,胡 波
華北計算機系統工程研究所,北京100083
摘要: 介紹了一種新的分層聚類算法,該聚類算法的主要目的是利用交點提供更好的聚類質量和更高的準確性。為了驗證該聚類算法,對基準數據集進行了幾次實驗,并與其他五種廣泛使用的聚類算法進行對比。使用純度作為外部標準來評估聚類算法的性能,并計算了由聚類算法得出的每個聚類的緊密度,以評估聚類算法的有效性。實驗結果表明,在大多數情況下,該算法的錯誤率低于研究中使用的其他聚類算法。
中圖分類號: TP393
文獻標識碼: A
DOI: 10.19358/j.issn.2096-5133.2020.10.004
引用格式: 李青旭,陳天鷹,胡波. 基于交點的新層次聚類算法[J].信息技術與網絡安全,2020,39(10):18-22.
New hierarchical clustering algorithm based on intersection
Li Qingxu,Chen Tianying,Hu Bo
National Computer System Engineering Research Institute of China,Beijing 100083,China
Abstract: This paper introduces a new hierarchical clustering algorithm. The main purpose of this clustering algorithm is to provide better clustering quality and higher accuracy by using intersections. In order to verify this clustering algorithm, we conducted several experiments on the benchmark data set. In addition to the algorithm we proposed, five well-known clustering algorithms were also used. The purity was used as an external standard to evaluate the performance of the clustering algorithm, and the tightness of each cluster obtained by the clustering algorithm was also calculated to evaluate the effectiveness of the clustering algorithm. Finally, the experimental results show that in most cases, the error rate of the proposed algorithm is lower than other clustering algorithms used in this study.
Key words : data mining;unsupervised learning;cluster analysis;clustering algorithm;hierarchical clustering

0 引言

    由于處理的數據量每天都在增加,因此能夠檢測數據結構并識別數據集中的子集的方法變得越來越重要。聚類是這些方法中的一種。聚類或聚類分析是一項無監督的歸納學習任務,它基于各個點之間的相似性將數據組織到同質的組中。聚類是機器學習,是數據挖掘和統計中已研究的基本問題之一[1-3]。聚類方法可以產生與分類方法相同的結果,但是不存在預定義的類,因此也可以視為無監督分類[4-5]

    聚類算法的性能可以通過其發現數據集中某些或所有隱藏模式的能力來衡量,可以通過測量數據點之間的相似性(不相似性)來發現隱藏的模式。相似度表示在明確定義的意義上測得的數學相似度,通常使用距離函數進行定義,根據聚類算法的規則,可以測量數據點本身之間或數據點與某個特殊點之間的距離。同時,隨著數據的劃分,同一群集中的數據點應盡可能相似,而不同群集中的數據點應盡可能不相似[6-7]。多年來,已經開發出多種不同的聚類方法。1998年,Fraley C和RAFTERY A E將聚類算法分為層次結構和分區兩組。Han和Kamber在2006年將聚類算法分為5類:分層、分區、基于密度、基于網格和基于模型[8]

    JOHNSON S定義的分層方法將點安排到一個基礎層次結構中,該層次結構隨后確定各種聚類[9]。層次聚類分為聚集和分裂兩種類型。聚集方法具有自下而上的過程,首先將每個數據點放置在其自己的聚類中,然后將聚類連續合并為更大的聚類,或者直到滿足給定的終止條件(例如特定數量的聚類)為止。分裂方法與聚集法相反,并且以自頂向下的方式執行。分區方法將數據集劃分為K個分區,每個分區代表一個聚類,它有兩種類型的分區,即清晰分區和模糊分區。如果數據集的每個數據點僅屬于一個簇,則稱為“清晰”,但如果允許數據點成為多個具有不同程度的簇的成員,則稱為“模糊”[10]。K-means和K-mediods方法是兩種常用的聚類方法。在K-means算法中,每個聚類由數據點的平均值表示,而在K-mediods中,一個聚類由聚類中位于最中心的數據點表示。

    在基于密度的方法中,簇是數據空間中最密集的區域,被較低密度的區域隔開。ESTER M等人1996年提出的空間聚類是基于密度的方法的一個示例,只要鄰域中的密度超過某個閾值,該方法就會不斷地增長聚類效果[11]。基于網格的方法將數據空間量化為有限數量的單元,這些單元形成一個網格結構,在該網格結構上執行所有用于聚類的操作,它與數據點無關,但與圍繞數據點的值空間有關。基于統計信息網格是WANG W等人1997年提出的基于網格的方法對空間數據集進行聚類的典型示例,在這種方法中,將空間區域劃分為由分層結構表示的矩形單元[12]。基于模型的聚類方法假定數據是由模型生成的,并嘗試從數據中發現原始模型,統計方法和神經網絡方法是基于模型的兩種主要方法[13]

    本文的目的是在分層聚類的基礎上優化分層算法,并使用更多的驗證措施來證明提出算法的強度。該算法使用交點作為鏈接標準,以合理的計算復雜度提供更有效、更準確的聚類結果。該算法的第一步是為每個數據點找出最接近的鄰居(NN),以形成對,然后找出對之間的交點以形成主聚類。本文以二維示例介紹了新的層次聚類算法,解釋了聚類評估,并介紹了新層次聚類算法與某些現有聚類算法進行比較的實驗結果。




本文詳細內容請下載:http://www.jysgc.com/resource/share/2000003131




作者信息:

李青旭,陳天鷹,胡  波

(華北計算機系統工程研究所,北京100083)

此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
欧美一区二区三区免费看| 老牛国产精品一区的观看方式| 亚洲欧美日本伦理| 日韩一级黄色大片| 亚洲黄页一区| 在线观看成人网| 韩国成人精品a∨在线观看| 国产精品欧美久久| 国产精品大片免费观看| 欧美三区在线| 欧美日韩免费观看一区三区| 欧美高清视频在线观看| 欧美大片免费| 欧美高清在线视频观看不卡| 欧美成人国产va精品日本一级| 久久综合久久88| 久久亚洲私人国产精品va媚药| 久久狠狠亚洲综合| 久久精品盗摄| 久久蜜桃精品| 久久久成人精品| 久久久久久亚洲精品杨幂换脸| 久久精品欧美日韩| 久久裸体视频| 免费一级欧美在线大片| 模特精品在线| 欧美激情综合五月色丁香小说| 欧美日韩播放| 欧美日韩国产在线看| 欧美色图首页| 国产精品一区二区久久| 国产精品揄拍500视频| 国产亚洲欧美中文| 国内一区二区三区在线视频| 激情综合亚洲| 亚洲欧洲精品一区二区三区| 亚洲蜜桃精久久久久久久| 在线性视频日韩欧美| 亚洲深夜av| 午夜精品久久久久| 亚洲高清久久久| 日韩一级在线| 午夜精品免费视频| 久久久久国产成人精品亚洲午夜| 巨乳诱惑日韩免费av| 欧美金8天国| 国产精品激情| 国产一区二区三区在线免费观看 | 在线看视频不卡| 亚洲麻豆视频| 亚洲欧美日韩国产成人| 亚洲国产成人在线播放| 一本久道久久综合中文字幕| 午夜欧美大尺度福利影院在线看| 久久精品一区| 欧美日韩国产经典色站一区二区三区| 国产精品国产| 在线观看三级视频欧美| 日韩一区二区精品葵司在线| 午夜视频在线观看一区二区| 亚洲精品日日夜夜| 香蕉久久夜色| 欧美成人按摩| 国产精品一区免费在线观看| 亚洲国产片色| 午夜精品福利在线| 99精品欧美一区| 久久精品在线免费观看| 欧美人与禽猛交乱配视频| 国产婷婷色一区二区三区四区| 亚洲激情国产精品| 午夜国产精品视频| av成人激情| 久久久精品国产一区二区三区| 欧美人与性动交α欧美精品济南到| 国产美女扒开尿口久久久| 亚洲激情欧美激情| 欧美亚洲在线| 亚洲性视频网站| 免费在线亚洲| 国产丝袜一区二区三区| 日韩一级在线观看| 亚洲国产小视频在线观看| 性欧美暴力猛交另类hd| 欧美日韩国产另类不卡| 在线播放日韩| 午夜精品久久久久久久99热浪潮| 一本大道av伊人久久综合| 久久亚洲午夜电影| 国产欧美日韩在线观看| 9色精品在线| 亚洲精品视频二区| 久久在线免费| 国产欧美综合一区二区三区| 日韩一级精品| 亚洲私人影院在线观看| 一区二区国产精品| 一本色道久久综合| 久久网站免费| 国产精品一级| 一本大道久久精品懂色aⅴ| 亚洲国产裸拍裸体视频在线观看乱了| 香蕉精品999视频一区二区| 欧美日韩另类国产亚洲欧美一级| 影音先锋亚洲精品| 欧美亚洲系列| 欧美在线视频在线播放完整版免费观看| 欧美激情一区二区三区四区| 激情综合在线| 久久精品国产欧美亚洲人人爽| 欧美一区二区三区在线看| 国产精品久久久久久久第一福利| 日韩网站在线观看| 一本久道久久综合狠狠爱| 欧美激情中文字幕一区二区| 亚洲高清成人| 亚洲人成7777| 免费中文字幕日韩欧美| 一区二区在线观看视频| 亚洲丰满少妇videoshd| 久久天天躁狠狠躁夜夜av| 国产一区二区三区av电影| 亚洲免费人成在线视频观看| 午夜精品99久久免费| 国产精品久久久久7777婷婷| 亚洲手机在线| 午夜精品久久99蜜桃的功能介绍| 国产精品裸体一区二区三区| 亚洲伊人色欲综合网| 香蕉成人伊视频在线观看| 国产精自产拍久久久久久| 亚洲一区中文字幕在线观看| 欧美一区二区三区免费观看视频 | 欧美日韩在线一区| 一级日韩一区在线观看| 亚洲一区美女视频在线观看免费| 欧美日韩精品免费看 | 亚洲福利在线看| 欧美成人精品在线| 亚洲激情不卡| 亚洲午夜91| 国产乱码精品一区二区三区不卡| 亚洲欧洲99久久| 久久综合导航| 亚洲人成在线观看网站高清| 亚洲私人影院在线观看| 国产精品美女久久福利网站| 欧美亚洲一区二区在线观看| 开元免费观看欧美电视剧网站| 亚洲国产女人aaa毛片在线| 夜夜爽99久久国产综合精品女不卡| 欧美日韩亚洲一区二区三区在线| 中文亚洲欧美| 久久精品免费播放| 亚洲第一在线视频| 在线亚洲一区| 国产伦精品一区二区三区视频黑人| 欧美一区二粉嫩精品国产一线天| 老司机免费视频一区二区| 最新中文字幕一区二区三区| 亚洲欧美日韩一区二区| 国产一区在线视频| 亚洲精选91| 国产精品毛片a∨一区二区三区| 性欧美暴力猛交另类hd| 欧美成人自拍| 亚洲一区二区黄| 美女视频网站黄色亚洲| 99综合精品| 久久躁日日躁aaaaxxxx| 日韩一级在线观看| 久久九九免费| 亚洲人成人一区二区三区| 欧美亚洲一级| 亚洲高清激情| 欧美一区二区私人影院日本| 亚洲电影天堂av| 午夜日本精品| 亚洲国产精品一区二区三区| 亚洲欧美日韩在线| 亚洲高清不卡在线观看| 午夜精品福利视频| 亚洲国产精品视频| 久久gogo国模裸体人体| 亚洲精选国产| 久久成人精品| 日韩一级精品| 米奇777在线欧美播放| 亚洲一区久久| 欧美激情女人20p| 欧美在线地址| 欧美午夜电影一区| 亚洲大片在线| 国产精品日本一区二区| 日韩午夜中文字幕| 国内揄拍国内精品少妇国语| 亚洲免费在线播放| 91久久精品日日躁夜夜躁欧美 | 日韩视频在线一区二区| 国产一区二区三区黄视频|