基于粗糙集的屬性選擇算法
大小:0.75 MB 人氣: 2018-01-05 需要積分:2
針對“大數(shù)據(jù)”中常見的大規(guī)模無監(jiān)督數(shù)據(jù)集中特征選擇速度難以滿足實際應用要求的問題,在經(jīng)典粗糙集絕對約簡增量式算法的基礎上提出了一種快速的屬性選擇算法。首先,將大規(guī)模數(shù)據(jù)集看作一個隨機到來的對象序列,并初始化候選約簡為空集;然后每次都從大規(guī)模數(shù)據(jù)集中無放回地隨機抽取一個對象,并且每次都判斷使用當前候選約簡能否區(qū)分這一對象和當前對象集中所有應當區(qū)分的對象,并將該對象放入到當前對象集中,如果不能區(qū)分則向候選約簡中添加合適的屬性;最后,如果連續(xù),次都沒有發(fā)現(xiàn)無法區(qū)分的對象,那么將候選約簡作為大規(guī)模數(shù)據(jù)集的約簡。在5個非監(jiān)督大規(guī)模數(shù)據(jù)集上的實驗表明,所求得的約簡能夠區(qū)分95 %以上的對象對,并且求取該約簡所需的時間不到基于區(qū)分矩陣的算法和增量式約簡算法的1%;在文本主題挖掘的實驗中,使用約簡后的數(shù)據(jù)集挖掘出的文本主題同原始數(shù)據(jù)集挖掘出的主題基本一致。兩組實驗結果表明該方法能夠有效快速對大規(guī)模數(shù)據(jù)集進行屬性選擇。
?
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
基于粗糙集的屬性選擇算法下載
相關電子資料下載
- LoRaWAN網(wǎng)絡服務器算法--下行路徑選擇算法對比與仿真(下) 160
- LoRaWAN網(wǎng)絡服務器算法--下行路徑選擇算法對比與仿真(上) 712
- 基于粗糙集聯(lián)合決策樹法的智能變電站遠程調(diào)度管理優(yōu)化 392
- 基于馬爾科夫邊界發(fā)現(xiàn)的因果特征選擇算法綜述 1045
- H.264中低復雜度的快速多參考幀選擇算法的應用研究 2421
- 一種新的H.264編碼幀間預測模式選擇算法 359
- 三種回歸算法及其優(yōu)缺點,將會為我們理解和選擇算法提供很好的幫助 13979
- 不同特征選擇算法的各自特點及其在微博業(yè)務應用中的演進歷程 3425
- 基于粗糙集理論的電力變壓器絕緣故障診斷 669