那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

利用機器學習(CART)來預測合格率

MinitabUG ? 來源:MinitabUG ? 作者:MinitabUG ? 2022-06-01 14:57 ? 次閱讀

人類一直試圖讓機器具有智能,也就是人工智能(Artificial Intelligence)。從上世紀50年代,人工智能的發展經歷了“推理期”,通過賦予機器邏輯推理能力使機器獲得智能,當時的AI程序能夠證明一些著名的數學定理,但由于機器缺乏知識,遠不能實現真正的智能。因此,70年代,人工智能的發展進入“知識期”,即將人類的知識總結出來教給機器,使機器獲得智能。 無論是“推理期”還是“知識期”,機器都是按照人類設定的規則和總結的知識運作,永遠無法超越其創造者,其次人力成本太高。于是,一些學者就想到,如果機器能夠自我學習問題不就迎刃而解了嗎!機器學習(Machine Learning)方法應運而生,人工智能進入“機器學習時期”。機器學習的核心是“使用算法解析數據,從中學習,然后對世界上的某件事情做出決定或預測”。機器學習最大的突破是2006年的深度學習。深度學習是一類機器學習,目的是模仿人腦的思維過程,經常用于圖像和語音識別。深度學習的出現導致了我們今天使用的(可能是理所當然的)許多技術。當你問你的iPhone關于今天的天氣時,你的話語會用一種復雜的語音解析算法進行分析。如果沒有深度學習,這一切都是不可能的。

機器學習與統計區別

pYYBAGKXDWKACMKNAAA4bACKLDA711.png

poYBAGKXDWWAQAX6AAA5Z5bbFYg105.png

機器學習是一類算法的總稱,這些算法企圖從大量歷史數據中挖掘出其中隱含的規律,并用于預測或者分類,更具體的說,機器學習可以看作是尋找一個函數,輸入是樣本數據,輸出是期望的結果,只是這個函數過于復雜,以至于不太方便形式化表達。
通常學習一個好的函數,分為以下三步:
1、選擇一個合適的模型,這通常需要依據實際問題而定,針對不同的問題和任務需要選取恰當的模型。
2、判斷一個函數的好壞,這需要確定一個衡量標準,如回歸問題一般采用歐式距離,分類問題一般采用交叉驗證函數。
3、找出“最好”的函數,如何從眾多函數中最快的找出“最好”的那一個,學習得到“最好”的函數后,需要在新樣本上進行測試,只有在新樣本上表現很好,才算是一個“好”的函數。
機器學習的核心是“使用算法解析數據,從中學習,然后對世界上的某件事情做出決定或預測”。這意味著,與其顯式地編寫程序來執行某些任務,不如教計算機如何開發一個算法來完成任務。有三種主要類型的機器學習:監督學習、非監督學習和強化學習。

pYYBAGKXDW6ADHLpAABfld12yy8326.png

poYBAGKXDXOAD3JYAAB2N-WRkBM572.png


【案例分享】為了預測過程輸出性能,提高客戶滿意度及產品質量,現從數據庫中批量導入了2019年5月份生產報表,檢測產品能否滿足規格要求及相關生產環境,試分析影響產品質量的相關原因及預測結果。
本例共有9個變量,近5000個測試數據,其數據表如下:

poYBAGKXDXyAOiVTAAFW-HVv7y4985.png

在Minitab最新發布的版本Minitab19.2020中,除了可以將Python的腳本可以導入Minitab加載分析之外,還增加了機器學習的CART分析法。我們將上述案例用CART分析步驟如下:
1、統計---預測分析---CART分類,將響應和影響因子分別填入對應位置

pYYBAGKXDYSAY9L2AAB5JPyPozw611.png

2、點擊 先驗/成本,設置誤分類成本

poYBAGKXDYqAYpQmAABYxWzMidc554.png

誤分類成本就是判斷錯誤的風險,例如,在醫學影像檢測中,把健康的人誤診為病人還不是最糟的情況,只要醫生能對診斷結果進行復查,并把健康的這個人找出來就可以了。但反過來,未能診斷出真正的病人而不提供給他任何治療,則就非常危險了。默認情況下,Minitab 使用相等的成本 1。
3、點擊 驗證,選擇驗證方法

pYYBAGKXDY-ATIAGAABmK-smvtA744.png

設置模型驗證:數據通常被分為訓練數據和測試數據
訓練數據(學習數據)通常被用來創建模型及評估模型的系數;測試數據通常檢模型性能,通過測試數據得到擬合值,在用訓練數據的數據和對應的擬合值進行比較來檢驗模型的預測性能通過驗證,防止模型過度擬合若用同一組數據來擬合模型并評估模型的擬合優度,會導致過度擬合,過度擬合的模型并不能用于很好的預測…..

pYYBAGKXDZSAaRnaAAAi3Ku8Ckg631.png

poYBAGKXDZmAUIZrAABqBExbbyo262.png

4、點擊 選項,設置節點分裂方式

poYBAGKXDaCAS7HaAAB89bjVzsY333.png

默認的節點分裂,選擇 基尼

pYYBAGKXDaWAWtd6AAAMQM6RLR4860.png

對所有對話框點擊 確定,查看Minitab輸出(部分):

poYBAGKXDamAbZ2eAABaPxEN2dE293.png


默認情況下,Minitab 為誤分類成本在最小誤分類成本 1 個標準誤內的最小樹生成輸出。也可以識別最優樹的序列中探索其他樹。終端節點數越多,模型就越復雜。

pYYBAGKXDa2APy3QAACjjrSgDQI944.png

poYBAGKXDbGARjSOAABWvCxAVaA760.png

ROC曲線指受試者工作特征曲線 / 接收器操作特性曲線(receiver operating characteristic curve), 是反映敏感性和特異性連續變量的綜合指標,是用構圖法揭示敏感性和特異性的相互關系,它通過將連續變量設定出多個不同的臨界值,從而計算出一系列敏感性和特異性,再以敏感性為縱坐標、(1-特異性)為橫坐標繪制成曲線,曲線下面積越大,診斷準確性越高。
點擊ROC圖左下角的預測,可以根據模型預測不同場景下的輸出概率。

pYYBAGKXDbiAPR3CAABneA62wHc255.png

總結:

機器學習是目前業界最為火熱的一項技術,從網上的每一次淘寶的購買東西,到自動駕駛汽車技術,以及網絡攻擊抵御系統等等,都有機器學習的因子在內,同時機器學習也是最有可能使人類完成“AI 夢”的一項技術,各種人工智能目前的應用,如微軟小冰聊天機器人,到計算機視覺技術的進步,都有機器學習努力的成分。作為全球領先的統計分析軟件,Minitab在2018年收購了SPM,并在Minitab.19.2020版中增加了預測分析的CART分類和CART回歸功能,能夠幫助我們了解一些機器學習的相關知識與概念,更好的理解為我們帶來莫大便利技術的背后原理,以及讓我們更好的理解當代科技的進程。

審核編輯:符乾江

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 預測分析
    +關注

    關注

    0

    文章

    11

    瀏覽量

    6450
  • Minitab
    +關注

    關注

    0

    文章

    180

    瀏覽量

    11763
  • 機器學習
    +關注

    關注

    66

    文章

    8439

    瀏覽量

    133087
收藏 人收藏

    評論

    相關推薦

    環球儀器Fuzion系列貼片機的優勢

    環球儀器貼片機的性能及產品合格率表現,早已公認為領先同行;為了協助廠家提高總體設備效率,環球儀器在設計Fuzion貼片機時,想方設法提高其使用效率。
    的頭像 發表于 01-16 09:23 ?199次閱讀
    環球儀器Fuzion系列貼片機的優勢

    什么是機器學習?通過機器學習方法能解決哪些問題?

    來源:Master編程樹“機器學習”最初的研究動機是讓計算機系統具有人的學習能力以便實現人工智能。因為沒有學習能力的系統很難被認為是具有智能的。目前被廣泛采用的
    的頭像 發表于 11-16 01:07 ?512次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    制造商利用云技術優化深度學習機器視覺的運行效率

    機器視覺,作為推動中國制造業蓬勃發展的關鍵技術,已在半導體、電子制造、汽車、醫藥及食品包裝等多個領域展現其廣泛應用價值。在此背景下,高工產業研究所(GGII)預測,至2024年,中國機器視覺市場規模將有望超過200億元,年增長
    的頭像 發表于 10-22 14:10 ?349次閱讀

    AI引擎機器學習陣列指南

    云端動態工作負載以及超高帶寬網絡,同時還可提供高級安全性功能。AI 和數據科學家以及軟硬件開發者均可充分利用高計算密度的優勢加速提升任何應用的性能。AI 引擎機器學習擁有先進的張量計
    的頭像 發表于 09-18 09:16 ?474次閱讀
    AI引擎<b class='flag-5'>機器</b><b class='flag-5'>學習</b>陣列指南

    【《時間序列與機器學習》閱讀體驗】+ 時間序列的信息提取

    本人有些機器學習的基礎,理解起來一點也不輕松,加油。 作者首先說明了時間序列的信息提取是時間序列分析的一個重要環節,目標是從給定的時間序列數據中提取出有用的信息和特征,以支持后續的分析和預測任務,可以
    發表于 08-14 18:00

    【「時間序列與機器學習」閱讀體驗】+ 鳥瞰這本書

    清晰,從時間序列分析的基礎理論出發,逐步深入到機器學習算法在時間序列預測中的應用,內容全面,循序漸進。每一章都經過精心設計,對理論知識進行了詳細的闡述,對實際案例進行了生動的展示,使讀者在理論與實踐
    發表于 08-12 11:28

    【「時間序列與機器學習」閱讀體驗】+ 簡單建議

    這本書以其系統性的框架和深入淺出的講解,為讀者繪制了一幅時間序列分析與機器學習融合應用的宏偉藍圖。作者不僅扎實地構建了時間序列分析的基礎知識,更巧妙地展示了機器學習如何在這一領域發揮巨
    發表于 08-12 11:21

    【《時間序列與機器學習》閱讀體驗】+ 了解時間序列

    。 可以探索現象發展變化的規律,對某些社會經濟現象進行預測利用時間序列可以在不同地區或國家之間進行對比分析,這也是統計分析的重要方法之一。 而《時間序列與機器學習》一書的后幾章分別
    發表于 08-11 17:55

    【「時間序列與機器學習」閱讀體驗】全書概覽與時間序列概述

    數據中提取特征并將其轉化為交易策略,以及機器學習在其他金融領域(包括資產定價、資產配置、波動預測)的應用。 全書彩版印刷,內容結構嚴整,條理清晰,循序漸進,由淺入深,是很好的時間序列
    發表于 08-07 23:03

    選擇對的氣密性檢測儀,提升汽車塑料蓋子合格率

    汽車塑料蓋子的合格率具有至關重要的作用。氣密性檢測儀,顧名思義,是一種用于檢測產品密封性能的設備。在汽車塑料蓋子的生產過程中,通過氣密性檢測儀可以精確地測量出蓋子
    的頭像 發表于 08-01 11:21 ?237次閱讀
    選擇對的氣密性檢測儀,提升汽車塑料蓋子<b class='flag-5'>合格率</b>

    機器學習的經典算法與應用

    關于數據機器學習就是喂入算法和數據,讓算法從數據中尋找一種相應的關系。Iris鳶尾花數據集是一個經典數據集,在統計學習機器學習領域都經常被
    的頭像 發表于 06-27 08:27 ?1729次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>的經典算法與應用

    名單公布!【書籍評測活動NO.35】如何用「時間序列與機器學習」解鎖未來?

    量化交易的概念、發展歷程,如何通過因子挖掘從時間序列數據中提取特征并將其轉化為交易策略,以及機器學習在其他金融領域(包括資產定價、資產配置、波動預測)的應用。 本書的兩位作者在時間
    發表于 06-25 15:00

    請問PSoC? Creator IDE可以支持IMAGIMOB機器學習嗎?

    我的項目使用 POSC62 MCU 進行開發,由于 UDB 模塊是需求的重要組成部分,所以我選擇了PSoC? Creator IDE 進行項目開發。 但現在,由于需要擴展,我不得不使用機器學習模塊
    發表于 05-20 08:06

    機器學習怎么進入人工智能

    ,人工智能已成為一個熱門領域,涉及到多個行業和領域,例如語音識別、機器翻譯、圖像識別等。 在編程中進行人工智能的關鍵是使用機器學習算法,這是一類基于樣本數據和模型訓練進行
    的頭像 發表于 04-04 08:41 ?388次閱讀

    機器學習8大調參技巧

    今天給大家一篇關于機器學習調參技巧的文章。超參數調優是機器學習例程中的基本步驟之一。該方法也稱為超參數優化,需要搜索超參數的最佳配置以實現最佳性能。
    的頭像 發表于 03-23 08:26 ?702次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>8大調參技巧
    百家乐龙虎的投注法| 百家乐官网站| 六合彩免费图库| 百家乐官网一黑到底| 挖掘百家乐赢钱秘籍| 澳门顶级赌场手机版| 百家乐官网博乐36bol在线 | 24山什么来龙是真龙| 大发888网页登录帐号| 百家乐官网电脑赌博| 3U百家乐的玩法技巧和规则| 百家乐官网在线小游戏| 樱桃木百家乐桌| 半圆百家乐官网桌子| KK百家乐的玩法技巧和规则| 八大胜百家乐官网现金网| 百家乐旺门打法| 大家赢百家乐官网投注| 如何赢百家乐的玩法技巧和规则| 游戏机百家乐官网的技术 | 百家乐官网园棋牌| 百家乐百战百胜| 百家乐官网秘诀| 百家乐投资| 榆次百家乐官网的玩法技巧和规则| 网狐棋牌源码| 百家乐拍是什么| 澳门百家乐官网秘诀| 真人百家乐蓝盾娱乐场| 百家乐官网赌博大揭密| 大发888casino| 百家乐加牌规则| 沽源县| 百家乐多少钱| 百家乐官网高手怎么下注| 新葡京娱乐城官网| 百家乐怎么样投注| 澳门赌百家乐官网打法| 大发888怎么了| 百家乐怎么下注能赢| 百家乐官网庄不连的概率|