那曲檬骨新材料有限公司

您好,歡迎來電子發燒友網! ,新用戶?[免費注冊]

您的位置:電子發燒友網>源碼下載>數值算法/人工智能>

一種在分布式環境下實現冪迭代聚類的方法

大小:0.69 MB 人氣: 2017-12-11 需要積分:1

  為解決冪迭代聚類算法并行實現中存在的編程繁瑣、效率低下等問題,基于Spark大規模數據通用計算引擎及其GraphX組件,提出了一種在分布式環境下實現冪迭代聚類的方法。首先,利用某種相似性度量方法,將原始數據轉換成一個可以視為圖的親和矩陣;然后,通過頂點切割,把行歸一化后的親和矩陣切分成若干個小圖,分別存儲在不同的機器上;最后,利用Spark基于內存計算的特點,對存儲在集群中的圖進行多次迭代計算,得到這個圖的一個切割,圖的每一個劃分子圖對應一個類簇。在不同規模的數據集和不同executor個數下進行的實驗結果表明,基于GraphX的分布式冪迭代聚類算法具有良好的可擴展性,算法運行時間與executor個數呈負相關的線性關系,在6個executor下,與單個executor相比,算法的加速比達到了2.09到3.77。同時,通過與基于Hadoop的冪迭代聚類進行對比,在新聞數量為40000篇時,運行時間降低了6l%。

一種在分布式環境下實現冪迭代聚類的方法

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發表評論

      用戶評論
      評價:好評中評差評

      發表評論,獲取積分! 請遵守相關規定!

      ?
      澳门百家乐官网皇冠网| 澳门百家乐官网赢钱公式不倒翁 | 百家乐官网平玩法可以吗| 博王娱乐| 女优百家乐的玩法技巧和规则 | 澳门百家乐官网送彩金| 辽宁棋牌游戏大厅| 百家乐游戏作弊| 包赢百家乐官网的玩法技巧和规则 | 在线百家乐下注| 阜城县| 大发888黄金版娱乐场| 做生意风水问题| 百家乐官网陷阱| 威尼斯人娱乐老牌网站| 微信百家乐官网群二维码 | 赌博百家乐官网玩法| 澳盈88投注| 大发888娱乐亚洲| 百家乐tt娱乐场开户注册| 最好的百家乐娱乐场| 百家乐官网baccarat| 太子娱乐城官网| 金利娱乐城代理| 大发888游戏场下载| 威尼斯人娱乐城官方网| 百家乐赢退输进有哪些| 百家乐隔一数打投注法| 赌博百家乐官网赢钱方法| 澳门百家乐官网加盟| 青浦区| 百家乐官网出千大全| 黔江区| 百家乐官网最新赌王| 百家乐官网里面的奥妙| 百家乐官网节目视频| 网上真钱棋牌游戏| 香港六合彩资料| 百家乐透明发牌机| 五张百家乐的玩法技巧和规则| 百家乐科学打法|