資料介紹
聚類分析是數(shù)據(jù)挖掘領(lǐng)域中一種非常有用的技術(shù),它用于從大量數(shù)據(jù)中尋找隱含的數(shù)據(jù)分布模式,主要有分割法、層次法、密度法、網(wǎng)格法和模型法等。該文主要討論數(shù)據(jù)挖掘中一種基于密度和網(wǎng)格的聚類分析算法及其在客戶關(guān)系管理中的應(yīng)用。該算法具有較高的聚類效率而且容易實(shí)現(xiàn),可以發(fā)現(xiàn)任意形狀的聚類,時(shí)間復(fù)雜度低,聚類精度高,適用于數(shù)據(jù)的批量更新。該文還提出增量式聚類技術(shù),它不僅能夠利用前期聚類的結(jié)果,充分提高聚類分析的效率,而且可以降低維護(hù)知識(shí)庫所帶來的巨大開銷。實(shí)驗(yàn)證明了算法的有效性。
關(guān) 鍵 詞 聚類分析; 客戶關(guān)系管理; 數(shù)據(jù)挖掘; 密度; 網(wǎng)格
Clustering analysis is a very useful tool in the domain of data mining for searching distributing mode from a great deal of data. Its main algorithms are partition-based algorithm, hierarchy-based algorithm, density-based algorithm, grid-based algorithm, and model-based algorithm. The paper mainly discusses a clustering algorithm based on density and grid in data mining, which has high clustering efficiency and low time complexity. It is efficient and effective for multi-density and uniformity density data sets with noise and suitable for batch update. After that an incremental clustering technique is presented. This technique not only makes best use of the former clustering results and improves the efficiency of clustering analysis, but also brings to the reduction of enormous expenditure on knowledge base maintenance. At last an application of the algorithm in Customer Relationship Management (CRM) is gien.
Key words clustering analysis; customer relationship management; data mining; density; grid
聚類分析是數(shù)據(jù)挖掘領(lǐng)域研究的重要課題[1],其基本思想是:按照數(shù)據(jù)的相似性和差異性,將數(shù)據(jù)劃分為若干組,同組的數(shù)據(jù)盡量相似,不同組的數(shù)據(jù)盡量相異[2-3]。迄今為止,人們已經(jīng)提出了許多聚類算法,主要有分割法、層次法、密度法、網(wǎng)格法和模型法等[4-6]。基于網(wǎng)格和密度的聚類算法由于易于增量實(shí)現(xiàn)和高維數(shù)據(jù)挖掘而被廣泛地應(yīng)用于聚類算法中。基于網(wǎng)格的方法在聚類過程中將網(wǎng)格中的點(diǎn)作為一個(gè)整體處理,而不是考慮單元中的每一個(gè)點(diǎn),基于這一特性,該方法在所有的聚類方法中效率最高。其優(yōu)點(diǎn)是聚類的結(jié)果與輸入數(shù)據(jù)的順序無關(guān),算法的時(shí)間復(fù)雜度是數(shù)據(jù)點(diǎn)個(gè)數(shù)的線性函數(shù),速度快、可擴(kuò)展性好,能識(shí)別不同形狀的聚類。
本文給出一種基于密度和網(wǎng)格的聚類算法,它是一個(gè)基于密度的算法,既保留了基于網(wǎng)格算法運(yùn)行速度快的特點(diǎn),又通過細(xì)化技術(shù)彌補(bǔ)了該類算法精度不好的弱點(diǎn)。
1 算法分析
在基于密度的算法中,一個(gè)聚類就是一個(gè)比周圍區(qū)域有更高數(shù)據(jù)點(diǎn)密度的區(qū)域[7]。為識(shí)別數(shù)據(jù)點(diǎn)的密度,將數(shù)據(jù)空間進(jìn)行劃分并找出每個(gè)單元中數(shù)據(jù)點(diǎn)的數(shù)目。為使計(jì)算點(diǎn)的密度的方法簡單一些,將數(shù)據(jù)空間分割成網(wǎng)格狀,把數(shù)據(jù)空間中的每一維劃分成相同的區(qū)間數(shù),每一個(gè)單元具有相同的“體積”[8-9]。單元中點(diǎn)的密度的計(jì)算可以轉(zhuǎn)換成簡單的點(diǎn)計(jì)數(shù),然后把落到某個(gè)單元中的點(diǎn)的個(gè)數(shù)作為該單元的密度。這時(shí)可以指定一個(gè)閾值r,當(dāng)某單元格中點(diǎn)的個(gè)數(shù)大于該閾值時(shí),就稱該單元格是密集的,聚類也就是所有相鄰近的密集單元格的集合。
- 基于群組和密度的大規(guī)模軌跡聚類算法 2次下載
- 基于網(wǎng)格多密度聚類的古建筑圖像特征匹配方法 3次下載
- 一種基于自然最近鄰的密度峰值聚類算法 12次下載
- 基于MapReduce和加權(quán)網(wǎng)絡(luò)信息熵的DBWGIE-MR算法 11次下載
- 一種自適應(yīng)的關(guān)聯(lián)融合聚類算法 13次下載
- 一種改進(jìn)的聚類聯(lián)合相似度推薦算法 10次下載
- 可檢測(cè)出租車載客的軌跡聚類算法 13次下載
- 如何使用拉普拉斯中心性和密度峰值進(jìn)行無參數(shù)聚類算法的研究 12次下載
- 如何融合密度峰值進(jìn)行高斯混合模型聚類算法概述 2次下載
- 如何使用多維網(wǎng)格空間進(jìn)行改進(jìn)K-means聚類算法資料概述 1次下載
- 聚類算法及聚類融合算法研究 33次下載
- 基于網(wǎng)格的多密度聚類算法
- 基于網(wǎng)格的帶有參考參數(shù)的聚類算法
- 基于模糊聚類思想的網(wǎng)格獨(dú)立任務(wù)調(diào)度算法
- 基于不均勻密度的自動(dòng)聚類算法
- 聚類分析中的機(jī)器學(xué)習(xí)與統(tǒng)計(jì)方法綜述(二) 1261次閱讀
- 如何在 Python 中安裝和使用頂級(jí)聚類算法 613次閱讀
- 代碼實(shí)現(xiàn)密度聚類DBSCAN 718次閱讀
- 10種頂流聚類算法Python實(shí)現(xiàn)(附完整代碼) 1617次閱讀
- CCM和CRM的圖騰柱PFC哪個(gè)效率更高? 4356次閱讀
- 機(jī)器學(xué)習(xí)技術(shù)在圖像處理中的應(yīng)用 2372次閱讀
- 10種聚類介紹和Python代碼 3156次閱讀
- 基于距離的聚類算法K-means的設(shè)計(jì)實(shí)現(xiàn) 2348次閱讀
- 淺析四類機(jī)器學(xué)習(xí)在自動(dòng)駕駛中的應(yīng)用 5605次閱讀
- Python無監(jiān)督學(xué)習(xí)的幾種聚類算法包括K-Means聚類,分層聚類等詳細(xì)概述 3w次閱讀
- 機(jī)器學(xué)習(xí)中五種常用的聚類算法 3.8w次閱讀
- 淺談Matlab中的聚類分析 Matlab聚類程序的設(shè)計(jì) 7382次閱讀
- 一種基于MapReduce模型的并行化k-medoids聚類算法 5377次閱讀
- 基于密度DBSCAN的聚類算法 2.1w次閱讀
- k means聚類算法實(shí)例 1.5w次閱讀
下載排行
本周
- 1電子電路原理第七版PDF電子教材免費(fèi)下載
- 0.00 MB | 1490次下載 | 免費(fèi)
- 2單片機(jī)典型實(shí)例介紹
- 18.19 MB | 93次下載 | 1 積分
- 3S7-200PLC編程實(shí)例詳細(xì)資料
- 1.17 MB | 27次下載 | 1 積分
- 4筆記本電腦主板的元件識(shí)別和講解說明
- 4.28 MB | 18次下載 | 4 積分
- 5開關(guān)電源原理及各功能電路詳解
- 0.38 MB | 10次下載 | 免費(fèi)
- 6基于AT89C2051/4051單片機(jī)編程器的實(shí)驗(yàn)
- 0.11 MB | 4次下載 | 免費(fèi)
- 7基于單片機(jī)和 SG3525的程控開關(guān)電源設(shè)計(jì)
- 0.23 MB | 3次下載 | 免費(fèi)
- 8基于單片機(jī)的紅外風(fēng)扇遙控
- 0.23 MB | 3次下載 | 免費(fèi)
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費(fèi)
- 2PADS 9.0 2009最新版 -下載
- 0.00 MB | 66304次下載 | 免費(fèi)
- 3protel99下載protel99軟件下載(中文版)
- 0.00 MB | 51209次下載 | 免費(fèi)
- 4LabView 8.0 專業(yè)版下載 (3CD完整版)
- 0.00 MB | 51043次下載 | 免費(fèi)
- 5555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33562次下載 | 免費(fèi)
- 6接口電路圖大全
- 未知 | 30320次下載 | 免費(fèi)
- 7Multisim 10下載Multisim 10 中文版
- 0.00 MB | 28588次下載 | 免費(fèi)
- 8開關(guān)電源設(shè)計(jì)實(shí)例指南
- 未知 | 21539次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935053次下載 | 免費(fèi)
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537791次下載 | 免費(fèi)
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費(fèi)
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費(fèi)
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費(fèi)
- 6電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191183次下載 | 免費(fèi)
- 7十天學(xué)會(huì)AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183277次下載 | 免費(fèi)
- 8proe5.0野火版下載(中文版免費(fèi)下載)
- 未知 | 138039次下載 | 免費(fèi)
評(píng)論
查看更多