那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器學習之關聯分析介紹

RG15206629988 ? 來源:行業學習與研究 ? 2023-03-25 14:13 ? 次閱讀

數據挖掘中應用較多的技術是機器學習。機器學習主流算法包括三種:關聯分析、分類分析、聚類分析。本文主要介紹關聯分析。

一、關聯分析概述

關聯分析可發現大量數據中隱藏的相關性(統計學的相關性分析不能直接發現數據中隱藏的相關性,需先人為猜測各變量間可能相關,再通過統計學計算相關性強弱),進而描述事物同時出現的規律和模式,被描述出的規律和模式可應用于市場營銷、事務分析等領域。

例如:某超市可通過關聯分析得出消費者購買牛奶和購買面包隱含的相關性。如果有關購買牛奶和購買面包衡量指標大于某一閾值,說明此二者相關,超市可以通過將售賣牛奶和面包的貨架靠近或推出牛奶和面包的組合裝促銷。

二、置信度與支持度

置信度與支持度是關聯分析的衡量指標。

置信度是指包含關聯規則所有特征(個人理解:特征可被理解為變量,包括自變量和因變量)的數據數量占包含自變量數據數量的比例。置信度高表示關聯規則所表示的自變量與因變量的相關性高。

支持度是指包含關聯規則的所有特征的數據數量占總數據數量的比例。支持度高表示關聯規則的出現頻率高,該關聯規則的重要性高。如果關聯規則的置信度高,但支持度低,表示該關聯規則出現頻率低,重要性低,利用價值低。

關聯分析需尋找支持度和置信度分別高于預先設定的支持度閾值和置信度閾值的關聯規則,該種關聯規則被稱為強關聯規則。不小于支持度閾值的關聯規則被稱為頻繁規則,不小于支持度閾值的特征集被稱為頻繁項集(項集可被理解為特征集,項、特征的具象化事物可以是商品,個人理解:頻繁規則和頻繁項集是一種事物兩個維度的表述)。

三、Apriori定律

在大數據關聯分析中,如果采用枚舉的方式找出所有的頻繁項集,則計算效率較低。因此,關聯分析可通過以下定律,簡化頻繁項集的確定過程。

Apriori定律1:頻繁項集的子集也是頻繁項集。如圖一所示,如果{C,D,E}是頻繁項集,意味著{C,D,E}在大數據中出現的頻率不小于支持度閾值,那么其子集如{C,D}在大數據出現的頻率也一定不小于支持度閾值,即為頻繁項集。

1c18de38-cac8-11ed-bfe3-dac502259ad0.png

圖一,圖片來源:嗶哩嗶哩《數據科學導論》

Apriori定律2:非頻繁項集的超集(個人理解:某集合的超集是包含該集合的集合)也不是頻繁項集。如圖二所示,如果{A,B}不是頻繁項集,意味著{A,B}在大數據中出現的頻率小于支持度閾值,那么其超集如{A,B,C}在大數據出現的頻率也一定小于支持度閾值,即不是頻繁項集。

1c37974c-cac8-11ed-bfe3-dac502259ad0.png

圖二,圖片來源:嗶哩嗶哩《數據科學導論》

以上兩定律在Apriori算法中被應用,Apriori算法是一種關聯分析算法。

四、關聯規則學習步驟

(1)找出所有的頻繁項集。

(2)根據頻繁項集生成頻繁規則。

(3)根據置信度指標進一步篩選頻繁規則。

五、確定候選項集的注意事項

在選擇候選項集(個人理解:候選項集指未進行置信度篩選的頻繁項集)需注意:

(1)應當避免產生太多不必要的候選項集。

(2)候選項集中不遺漏頻繁項集。

(3)不產生重復候選項集。





審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8438

    瀏覽量

    133086
  • Apriori算法
    +關注

    關注

    0

    文章

    14

    瀏覽量

    10578

原文標題:大數據相關介紹(24)——機器學習之關聯分析

文章出處:【微信號:行業學習與研究,微信公眾號:行業學習與研究】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    嵌入式機器學習的應用特性與軟件開發環境

    設備和智能傳感器)上,這些設備通常具有有限的計算能力、存儲空間和功耗。本文將您介紹嵌入式機器學習的應用特性,以及常見的機器學習開發軟件與開發
    的頭像 發表于 01-25 17:05 ?173次閱讀
    嵌入式<b class='flag-5'>機器</b><b class='flag-5'>學習</b>的應用特性與軟件開發環境

    【「具身智能機器人系統」閱讀體驗】+兩本互為支持的書

    最近在閱讀《具身智能機器人系統》這本書的同時,還讀了 《計算機視覺PyTorch數字圖像處理》一書,這兩本書完全可以視為是互為依托的姊妹篇。《計算機視覺PyTorch數字圖像處理》是介紹
    發表于 01-01 15:50

    傳統機器學習方法和應用指導

    在上一篇文章中,我們介紹機器學習的關鍵概念術語。在本文中,我們會介紹傳統機器學習的基礎知識和多
    的頭像 發表于 12-30 09:16 ?394次閱讀
    傳統<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法和應用指導

    zeta在機器學習中的應用 zeta的優缺點分析

    在探討ZETA在機器學習中的應用以及ZETA的優缺點時,需要明確的是,ZETA一詞在不同領域可能有不同的含義和應用。以下是根據不同領域的ZETA進行的分析: 一、ZETA在機器
    的頭像 發表于 12-20 09:11 ?361次閱讀

    什么是機器學習?通過機器學習方法能解決哪些問題?

    計算機系統自身的性能”。事實上,由于“經驗”在計算機系統中主要以數據的形式存在,因此機器學習需要設法對數據進行分析學習,這就使得它逐漸成為智能數據
    的頭像 發表于 11-16 01:07 ?512次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    【《時間序列與機器學習》閱讀體驗】+ 時間序列的信息提取

    本人有些機器學習的基礎,理解起來一點也不輕松,加油。 作者首先說明了時間序列的信息提取是時間序列分析的一個重要環節,目標是從給定的時間序列數據中提取出有用的信息和特征,以支持后續的分析
    發表于 08-14 18:00

    【「時間序列與機器學習」閱讀體驗】+ 鳥瞰這本書

    清晰,從時間序列分析的基礎理論出發,逐步深入到機器學習算法在時間序列預測中的應用,內容全面,循序漸進。每一章都經過精心設計,對理論知識進行了詳細的闡述,對實際案例進行了生動的展示,使讀者在理論與實踐
    發表于 08-12 11:28

    【「時間序列與機器學習」閱讀體驗】+ 簡單建議

    這本書以其系統性的框架和深入淺出的講解,為讀者繪制了一幅時間序列分析機器學習融合應用的宏偉藍圖。作者不僅扎實地構建了時間序列分析的基礎知識,更巧妙地展示了
    發表于 08-12 11:21

    【《時間序列與機器學習》閱讀體驗】+ 了解時間序列

    。 可以探索現象發展變化的規律,對某些社會經濟現象進行預測。 利用時間序列可以在不同地區或國家之間進行對比分析,這也是統計分析的重要方法之一。 而《時間序列與機器學習》一書的后幾章分別
    發表于 08-11 17:55

    【「時間序列與機器學習」閱讀體驗】全書概覽與時間序列概述

    他領域(如自然語言處理、計算機視覺等)的關聯。 ●第2章“時間序列的信息提取”:介紹特征工程的核心概念及其在時間序列分析中的廣用,比如對原始數據進行歸一化、缺失值填充等轉換;以及如何通過特征工程從時間
    發表于 08-07 23:03

    機器學習在數據分析中的應用

    隨著大數據時代的到來,數據量的爆炸性增長對數據分析提出了更高的要求。機器學習作為一種強大的工具,通過訓練模型從數據中學習規律,為企業和組織提供了更高效、更準確的數據
    的頭像 發表于 07-02 11:22 ?810次閱讀

    深度學習與傳統機器學習的對比

    在人工智能的浪潮中,機器學習和深度學習無疑是兩大核心驅動力。它們各自以其獨特的方式推動著技術的進步,為眾多領域帶來了革命性的變化。然而,盡管它們都屬于機器
    的頭像 發表于 07-01 11:40 ?1540次閱讀

    名單公布!【書籍評測活動NO.35】如何用「時間序列與機器學習」解鎖未來?

    應用,將理論基礎與實踐案例相結合,作者憑借扎實的數學功底及其在企業界的豐富實踐經驗,將機器學習與時間序列分析巧妙融合在書中。 全書書共分為8章,系統介紹時間序列的基礎知識、常用預測方法
    發表于 06-25 15:00

    機器學習入門:基本概念介紹

    機器學習(GraphMachineLearning,簡稱GraphML)是機器學習的一個分支,專注于利用圖形結構的數據。在圖形結構中,數據以圖的形式表示,其中的節點(或頂點)表示實體
    的頭像 發表于 05-16 08:27 ?550次閱讀
    圖<b class='flag-5'>機器</b><b class='flag-5'>學習</b>入門:基本概念<b class='flag-5'>介紹</b>

    arcgis中如何關聯兩個屬性表

    在ArcGIS中,關聯兩個屬性表是一個重要的操作,可以通過此操作將兩個表中的數據關聯起來,以便進行分析和查詢。下面是詳細介紹如何在ArcGIS中實現屬性表的
    的頭像 發表于 02-25 11:01 ?4467次閱讀
    百家乐官网赢钱密籍| 百家乐官网香港六合彩| 永利高百家乐官网会员| 百家乐官网道具扫描| 做生意店铺风水好吗| 百家乐透明发牌靴| 大发888在线下载| SHOW| 博天堂百家乐官网的玩法技巧和规则 | 襄城县| 百家乐官网便利| 百家乐的巧门| 香港六合彩总公司| 百家乐官网园sun811| 百家乐投注双赢技巧| 真人百家乐| 百家乐官网玩法说明| 金樽百家乐官网的玩法技巧和规则 | 百家乐怎打能赢| 网上百家乐官网靠谱吗| 百家乐洗码全讯网| 网球比赛直播| 玩百家乐官网技巧看| 怎样玩百家乐官网的玩法技巧和规则| 百家乐赌博分析网| 金狮国际| 百家乐庄闲客户端| 棋牌小游戏| 三亚百家乐官网的玩法技巧和规则| 威尼斯人娱乐城会员注册| 百家乐官网游戏资料网| 百家乐一起多少张牌| 安国市| 新世纪百家乐现金网| 蒙特卡罗代理| 百家乐如何必胜| 大发888娱乐城下载地址| 百家乐官网21点游戏| 百家乐网页qq| 御金百家乐官网娱乐城| 威尼斯人娱乐 老品牌|