資料介紹
針對現有Eclat算法中普遍存在的候選集規模大、求交效率低的問題,提出了基于剪枝優化和索引求交的改進Eclat算法。首先根據頻繁集的性質采用預剪枝和后剪枝相結合的候選集優化策略,即利用預剪枝技術裁剪待連接的項集數量以減少項集連接操作,同時利用先驗性質對連接后的項集進行后剪枝處理;接著提出了一種基于事務索引的布爾數組求交方法,即通過將事務標識作為索引來設置并檢索布爾數組,以獲得項集支持度計數;最后通過設計對比實驗,在經典數據集上測試該方法的有效性。實驗表明,通過該方法能夠有效壓縮候選集規模,改善求交計算效率,特別是在支持度閾值小、事務數規模大的情況下,算法的運行效率得到了明顯的提升。
現如今,通過使用數據挖掘技術,我們可以從海量數據中挖掘有趣的信息。其中,關聯規則挖掘是數據挖掘技術中較為重要的一種手段。它一般分為兩個步驟:一是依據事先設定的支持度閾值找出所有符合條件的頻繁項集;二是依據頻繁項集及給定的置信度閾值產生關聯規則。其中,挖掘算法的性能主要取決于頻繁項集的生成,因此識別或發現所有頻繁項目集是關聯規則挖掘算法的核心。隨著數據挖掘技術理論研究的深入,各類關聯規則挖掘算法也在不斷地涌現。傳統的算法主要包括Apriori算法、FP-growth 算法以及Eclat 算法,后續的大部分算法都是在這三類算法的基礎上進行相應的優化和改進。
Apriori 算法使用一種稱為逐層搜索的迭代方法,通過項目集元素數目的不斷增長來逐步完成頻繁項集的發現,核心思想是通過候選集生成和情節的向下封閉檢測兩個階段來挖掘頻繁項集,該算法設計思想簡單,易于實現,但是產生了大量候選集,同時需要多次對事務庫進行掃描,計算耗時過長;FP-growth 算法使用一種稱為頻繁模式增長的方法,采取分治策略,將代表頻繁項集的數據庫壓縮到一棵頻繁模式樹(FP 樹)上,然后把這種壓縮后的數據庫劃分成條件數據庫,每個數據庫關聯一個頻繁項或“模式段”,并分別挖掘每個條件數據庫,這種方法可以顯著地壓縮被搜索的數據集的大小,該算法只掃描事務庫兩次,且無需產生候選集,相比Apriori 算法性能有顯著的提高,但由于所有項集都壓縮在一棵樹上,對內存要求較高,且遞歸算法設計復雜;Eclat 算法[4]的核心思想是將水平數據庫轉換成垂直數據庫,然后將項集的TID_set 進行交運算來得到項集的支持度,該算法由于只掃描一次事務庫,且項集支持度是通過交運算得到的,大大減少了計算時間,但Eclat 算法存在搜索空間大、連接操作頻繁、求交運算耗時的問題。
本文選取上述幾類算法中性能較好的Eclat 算法,結合近年來該算法的相關研究,針對其普遍存在的問題和不足,從候選集的生成和支持度的計算兩個方面對其加以優化和改進,提出了前后剪枝相結合的候選集優化策略以及利用數組索引取值計數的求交運算方法,以達到提高Eclat 算法效率的目的。
- 基于改進郊狼優化算法的淺層神經網絡進化 15次下載
- 基于ReliefF剪枝的多標記分類算法綜述 12次下載
- 改進鯨魚優化算法在路徑規劃的應用綜述 15次下載
- 改進膠囊網絡優化分成卷積的亞健康識別 7次下載
- 基于改進自適應權重的立體匹配優化算法 3次下載
- 基于改進的蝗蟲優化算法的LSTM預測方法 7次下載
- 一種改進的聚類聯合相似度推薦算法 10次下載
- 一種改進的花朵授粉算法的WEB服務組合優化 7次下載
- 一種改進的哈里斯鷹優化定位算法 6次下載
- 嵌入式設備的YOLO網絡剪枝算法 4次下載
- 基于深度神經網絡的結構化剪枝算法 2次下載
- 關于蟻群算法的改進優化(源程序)資料下載 5次下載
- 基于改進果蠅優化算法的雷電定位研究_郭小紅 0次下載
- 一種改進的神經網絡相關性剪枝算法 0次下載
- 基于平均單元格的三角網格曲面快速求交算法
- 谷歌搜索引擎優化的各個方面和步驟 929次閱讀
- Mysql索引是什么東西?索引有哪些特性?索引是如何工作的? 1390次閱讀
- 邊緣計算計算卸載與資源分配聯合優化算法 1275次閱讀
- 如何對spmv算法進行優化 1257次閱讀
- 基于改進FCOS的鋼帶表面缺陷檢測算法 1692次閱讀
- 用于實現并行處理加速硬件的H.264算法的改進和優化 2278次閱讀
- 大數據是如何優化企業搜索引擎 2262次閱讀
- 什么是決策樹?決策樹算法思考總結 1.1w次閱讀
- 基于動態矩陣方法改進了傳統CACC模型預測控制算法 6646次閱讀
- 數據集,網絡架構和剪枝方法 5948次閱讀
- 數據挖掘算法:決策樹算法如何學習及分裂剪枝 5815次閱讀
- K-means的優缺點及改進 3.2w次閱讀
- 關聯規則挖掘——Apriori算法的基本原理以及改進 9439次閱讀
- 配電網絡重構的改進混合遺傳算法 1163次閱讀
- 基于改進模擬退火算法的電網無功優化 807次閱讀
下載排行
本周
- 1TC358743XBG評估板參考手冊
- 1.36 MB | 330次下載 | 免費
- 2開關電源基礎知識
- 5.73 MB | 11次下載 | 免費
- 3嵌入式linux-聊天程序設計
- 0.60 MB | 3次下載 | 免費
- 4DIY動手組裝LED電子顯示屏
- 0.98 MB | 3次下載 | 免費
- 5基于FPGA的C8051F單片機開發板設計
- 0.70 MB | 2次下載 | 免費
- 651單片機窗簾控制器仿真程序
- 1.93 MB | 2次下載 | 免費
- 751單片機大棚環境控制器仿真程序
- 1.10 MB | 2次下載 | 免費
- 8基于51單片機的RGB調色燈程序仿真
- 0.86 MB | 2次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 2555集成電路應用800例(新編版)
- 0.00 MB | 33566次下載 | 免費
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費
- 4開關電源設計實例指南
- 未知 | 21549次下載 | 免費
- 5電氣工程師手冊免費下載(新編第二版pdf電子書)
- 0.00 MB | 15349次下載 | 免費
- 6數字電路基礎pdf(下載)
- 未知 | 13750次下載 | 免費
- 7電子制作實例集錦 下載
- 未知 | 8113次下載 | 免費
- 8《LED驅動電路設計》 溫德爾著
- 0.00 MB | 6656次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費
- 2protel99se軟件下載(可英文版轉中文版)
- 78.1 MB | 537798次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420027次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191186次下載 | 免費
- 7十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183279次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138040次下載 | 免費
評論