那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

開發(fā)有效的機器學習你應該知道這6個經驗教訓

汽車玩家 ? 來源:電子創(chuàng)新網 ? 作者:James Warner ? 2020-01-28 09:36 ? 次閱讀

機器人技術、智能家電、智能零售店、自動駕駛汽車技術等的推動下,我們正步入一個新時期。機器學習是所有這些新時代技術進步的前沿。在不久的將來,自動化機器的發(fā)展將使得機器與人類智能相當甚至超過人類智能。機器學習無疑是下一個“大”事件。而且,人們相信,未來的大多數(shù)技術都將與之掛鉤。

為什么機器學習這么重要?

機器學習非常重要,因為它有助于預測人類無法預測的行為和模式。機器學習有無數(shù)非常有用的實際應用。通過機器學習,有可能管理以前令人困惑的場景。在理解了具有高效泛化能力的機器學習模型之后,可以使用它做出相應的重要決策。機器學習使個人能夠根據(jù)大量場景做出決策。顯然,現(xiàn)在還不能編寫出能夠用于所有新場景的代碼。

人工智能能夠執(zhí)行各種需要學習和判斷的活動。從自動駕駛汽車、投資銀行、許多醫(yī)療相關功能到招聘,人工智能已經被用于完成不同領域的各種任務。

6 個關于機器學習的革命性教訓

機器學習算法能夠簡單地從場景中泛化,得到執(zhí)行必要任務的方法。這樣更切實可行和而且具有成本效益,然而,手工編程并不那么具有成本效益和可行性。“可用數(shù)據(jù)”數(shù)量的增加肯定會導致出現(xiàn)更多的與獲取數(shù)據(jù)相關的問題。因此,機器學習是未來,因為它將廣泛應用于計算機和其他領域。盡管如此,開發(fā)有效的機器學習應用需要大量的“黑魔法”,這在手冊中很難找到。

以下是關于機器學習最有價值的 6 個經驗教訓:

1. 泛化是核心

機器學習最基本的特征之一是,算法必須從訓練的數(shù)據(jù)中泛化出該領域中所有不可見場景的完整領域,以便在使用模型時能夠做出正確的推斷。這個泛化的過程需要我們用來訓練模型的數(shù)據(jù)有一個我們希望算法去學習的,像樣的和可靠的映射。數(shù)據(jù)的質量越好,表達能力越高,模型就越容易理解從輸入到輸出的未知的和基本的“真實”映射。泛化是指從某種精確的東西轉向某種廣泛的東西。

機器學習算法是從歷史場景中自動簡化的技術。它們有能力在更大的數(shù)據(jù)量和更快的速度上進行泛化。

所有機器學習初學者最常犯的錯誤就是對訓練數(shù)據(jù)進行測試,然后看起來像是成功了。如果在新數(shù)據(jù)上嘗試所得到分類器,它通常不會比隨機猜測更好。所以,如果你想要開發(fā)一個分類器,一定要留一些數(shù)據(jù)做測試。同時,用你的分類器對測試數(shù)據(jù)進行測試。

2. 學習=表示+評估+優(yōu)化

機器學習算法分為 3 個部分,表示、評估和優(yōu)化

表示:數(shù)據(jù)需要以合適的算法形式輸入。對于文本分類,可以從全文輸入中提取特征,并將其變?yōu)?bag-of-words 的表示形式。相反,選擇一種表示方法與選擇它可能學習的分類器集是同義詞。這個集合稱為學習者的假設空間。

評估:這是一個幫助我們理解我們正在做什么的度量。需要一個評估過程來區(qū)分好分類器和不好的分類器。如果你可以給測試集預測出一個數(shù)字,例如測試集的大小為 n,在這里,你可以計算平均絕對誤差,甚至可以選擇使用均方根誤差。

優(yōu)化:它是指尋找方法來選擇不同的技術來優(yōu)化它的過程。例如,我們可以簡單地嘗試假設空間中的每一個假設。我們也可能選擇使用更智能的技術來嘗試最有利的假設。同時,當我們進行優(yōu)化時,我們可以利用評價函數(shù)來了解這個特定的假設是否成立。如果評價函數(shù)有多個最優(yōu)值,則優(yōu)化技術允許用戶了解更多關于所創(chuàng)建分類器的信息。首先,初學者應該從現(xiàn)成的優(yōu)化器開始,然后再轉向定制設計的優(yōu)化器。

3. 只有數(shù)據(jù)是不夠的!

泛化是主要目的,但主要關注的是,無論數(shù)量多少,僅有數(shù)據(jù)是不夠的。但是,幸運的是,我們想掌握的功能并不是從所有可計算的功能中統(tǒng)一得出的!即使是最一般的假設(包括平滑度,具有類似類的相似示樣本,不充分的依存關系或受限制的復雜度)也足以正常運行,這是使機器學習如此強大的主要原因之一。基本上,所有初學者都聯(lián)合了解大數(shù)據(jù)來制作應用程序。

4. 小心過擬合

如果數(shù)據(jù)不充分,不能完全訓練好一個分類器,我們可能最終得到的是只在訓練集上有用的分類器。這個問題被稱為 overfitting,它被認為是 ML 的一個麻煩事。發(fā)現(xiàn)自己的模型過擬合了是有用的,但并不能解決這個問題。你得想辦法擺脫它。幸運的是,你有很多選擇去嘗試。交叉驗證有助于防止過擬合。訓練更多的數(shù)據(jù),正則化,刪除特征,早期停止,集成是一些其他的防止過擬合的方法。

5. 特征工程是成功的關鍵

特征工程是利用數(shù)據(jù)的核心領域知識來開發(fā)使機器學習算法更好工作的特征的技術。如果處理得當,它可以通過從原始數(shù)據(jù)中開發(fā)特征來增強算法的預測能力。這些特征簡化了整個機器學習過程。利用幾個獨立的特征,很好地與類相關,然后讓學習變得容易。

6. 準確性&簡單性是不一樣的

奧卡姆剃刀(Occam’s razor)精辟地指出,實體的增加不應超出要求。這意味著兩個分類器有相似的訓練誤差,兩個分類器中較簡單的可能有最低的測試誤差。每一個機器學習項目都應該以你希望回答的業(yè)務問題為目標。你應該從制定分析的主要成功原則開始。

應用 Occam’s razor 并選擇最容易解釋、闡明、部署和管理的模型是構建強大的機器學習程序的關鍵步驟。建議選擇最簡單的、足夠精確的模型,但是,要確保你深入了解這個問題,以了解“足夠精確”在實踐中意味著什么。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    211

    文章

    28641

    瀏覽量

    208412
  • 人工智能
    +關注

    關注

    1796

    文章

    47666

    瀏覽量

    240287
  • 機器學習
    +關注

    關注

    66

    文章

    8438

    瀏覽量

    133084
收藏 人收藏

    評論

    相關推薦

    工程師13年編碼、測試和調試經驗大匯總

    最近,我回顧了我所有的194條目(從13歲開始),看看有什么經驗教訓是我可以學習的。下面是我總結的最重要的經驗教訓,包括編碼,測試和調試三
    發(fā)表于 07-17 22:41 ?2036次閱讀

    名單公布!【書籍評測活動NO.33】做了50年軟件開發(fā),總結出60條經驗教訓,每一條都太扎心!

    的60 條經驗教訓 ,分為 6 領域,每個領域占用 1 章的篇幅。 所有的 60 條經驗教訓都會收錄在附錄中,以便大家參考。 我并沒
    發(fā)表于 05-17 14:36

    生物識別可穿戴產品開發(fā)有什么經驗教訓

    設想一下,您正在參加一計劃會議。團隊剛剛提出了一些非常棒的想法,他們?yōu)樾碌目纱┐髟O備設計了一種光學心率傳感器,您可以將其添加到您的產品線中。他們都向您求助:我們應該與誰合作開發(fā)傳感器系統(tǒng)? 突然間您意識到你并不完全確定從哪里著
    發(fā)表于 08-06 07:27

    求大神分享單片機從業(yè)的經驗教訓學習歷程?

    求大神分享單片機從業(yè)的經驗教訓學習歷程?
    發(fā)表于 09-18 09:16

    珠海炬力與SigmaTel達成和解的經驗教訓

    珠海炬力與SigmaTel達成和解的經驗教訓:珠海炬力是我國一家領先的集成電路設計公司,成立以來堅持以市場為導向,堅持自主創(chuàng)新。因此在公司發(fā)展,市場開拓等等方面成績斐然,
    發(fā)表于 12-24 10:58 ?4次下載

    借鑒開發(fā)人員累計的經驗教訓構建更出色的嵌入式系統(tǒng)

    隨著嵌入式系統(tǒng)不斷普及,我們可以從積累的開發(fā)知識中獲得巨大優(yōu)勢,構建更出色的系統(tǒng)。 工程師一刻也沒忘記交付能同時滿足質量、時間安排和預算目標的項目的需求。一事半功倍的方法 就是借鑒嵌入式系統(tǒng)開發(fā)人員社區(qū)多年來累計的
    發(fā)表于 11-16 20:44 ?1138次閱讀
    借鑒<b class='flag-5'>開發(fā)</b>人員累計的<b class='flag-5'>經驗教訓</b>構建更出色的嵌入式系統(tǒng)

    工程師跨度13年、回顧194bug總結的18條編碼、測試和調試經驗教訓

    工程師跨度13年、回顧194bug總結的18條編碼、測試和調試經驗教訓
    發(fā)表于 02-27 16:50 ?1093次閱讀

    google機器學習團隊開發(fā)機器學習系統(tǒng)Seti的一些經驗教訓

    system》的博客,作者應該是google機器學習團隊的成員,列舉了他們在開發(fā)可伸縮的大型機器
    發(fā)表于 06-01 09:25 ?1696次閱讀

    企業(yè)如何從智能家居中吸取經驗教訓

    這是一機會眾多的領域,越來越多的設備制造商正在嘗試利用這一領域,并且具有無限可能性——尤其是那些能夠從智能家居中吸取經驗教訓的企業(yè)。
    的頭像 發(fā)表于 11-19 14:17 ?2869次閱讀

    Pedro Domingos教授的研究論文匯集機器學習研究人員的經驗教訓

    機器學習算法被認為能夠通過學習數(shù)據(jù)來弄清楚如何執(zhí)行重要任務。意味著數(shù)據(jù)量越大,這些算法就可以解決更加復雜的問題。然而,開發(fā)成功的
    的頭像 發(fā)表于 05-17 11:35 ?1972次閱讀

    AI和機器學習歷程經驗教訓總結

    我最近有幸與幾位AI /機器學習專家一起參加了小組討論。 有很多偉大的問題,但大多數(shù)與如何在大型組織中最有效地建立AI /機器學習(AI /
    的頭像 發(fā)表于 05-03 18:06 ?2350次閱讀

    寫在最前:單片機從業(yè)的經驗教訓和歷程。

    單片機從業(yè)的經驗教訓和歷程寫在開始為什么寫這些怎么學習的有什么教訓經驗**1如果的學校還在用匯編教學單片機,那么請放棄教學課程混
    發(fā)表于 11-15 13:36 ?7次下載
    寫在最前:單片機從業(yè)的<b class='flag-5'>經驗教訓</b>和歷程。

    NASA的經驗教訓文件中的一些電氣工程事故

    在航天器完成之前,美國宇航局的經驗教訓檔案中的一條目詳細介紹了一名工程師在下班后在沒有適當測試協(xié)議的情況下對麥哲倫動力控制單元進行測試。如果沒有質量保證概述或測試程序,就會出現(xiàn)錯誤并在設備上施加反向電壓。
    的頭像 發(fā)表于 10-20 14:29 ?942次閱讀

    從50多個生物識別可穿戴產品開發(fā)周期得到的十大經驗教訓

    從50多個生物識別可穿戴產品開發(fā)周期得到的十大經驗教訓
    發(fā)表于 11-01 08:26 ?0次下載
    從50多個生物識別可穿戴產品<b class='flag-5'>開發(fā)</b>周期得到的十大<b class='flag-5'>經驗教訓</b>

    嵌入式微控制器應用中的無線(OTA)更新:設計權衡與經驗教訓

    電子發(fā)燒友網站提供《嵌入式微控制器應用中的無線(OTA)更新:設計權衡與經驗教訓.pdf》資料免費下載
    發(fā)表于 11-23 16:01 ?0次下載
    嵌入式微控制器應用中的無線(OTA)更新:設計權衡與<b class='flag-5'>經驗教訓</b>
    路虎百家乐的玩法技巧和规则 | 38坊娱乐城| 百家乐打鱼秘籍| 百家乐官网正负计| 足球投注| 百家乐斗地主下载| 电脑赌百家乐官网可靠吗| 金宝博188| 狮威百家乐的玩法技巧和规则| 网络百家乐官网破| 百家乐官网室系统软件| 大发888账号注册| 百家乐金海岸软件| 模拟百家乐官网的玩法技巧和规则| 佳豪国际| 太阳百家乐管理网| 百家乐胜率在哪| 缅甸百家乐官网赌博有假吗| 六合彩图纸| 淘金百家乐的玩法技巧和规则| 百家乐官网社区| 现金百家乐官网破解| 盈乐博| 百家乐博彩吧| 百家乐龙虎的投注法| 澳门百家乐官网官网站| 百家乐官网案件讯问| 德州扑克保险赔率| 金海岸百家乐的玩法技巧和规则| 百家乐星级游戏| 真钱百家乐官网大转轮| 峨边| 大发888娱乐城官方网站| 百家乐平台送彩金| 网上百家乐网址| 百家乐官网赌博规律| 三都| 万利娱乐城开户| 威尼斯人娱乐城 196| 百家乐庄闲和的倍数| 百家乐打法内容介绍|