那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

什么是機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)到底有什么重要性詳細(xì)資料說明

C語言專家集中營 ? 來源:未知 ? 2019-03-03 10:13 ? 次閱讀

在本篇文章中,我將對機(jī)器學(xué)習(xí)做個概要的介紹。本文的目的是能讓即便完全不了解機(jī)器學(xué)習(xí)的人也能了解機(jī)器學(xué)習(xí),并且上手相關(guān)的實踐。這篇文檔也算是EasyPR開發(fā)的番外篇,從這里開始,必須對機(jī)器學(xué)習(xí)了解才能進(jìn)一步介紹EasyPR的內(nèi)核。當(dāng)然,本文也面對一般讀者,不會對閱讀有相關(guān)的前提要求。

在進(jìn)入正題前,我想讀者心中可能會有一個疑惑:機(jī)器學(xué)習(xí)有什么重要性,以至于要閱讀完這篇非常長的文章呢?

我并不直接回答這個問題前。相反,我想請大家看兩張圖,下圖是圖一:

圖1 機(jī)器學(xué)習(xí)界的執(zhí)牛耳者與互聯(lián)網(wǎng)界的大鱷的聯(lián)姻

這幅圖上上的三人是當(dāng)今機(jī)器學(xué)習(xí)界的執(zhí)牛耳者。中間的是Geoffrey Hinton, 加拿大多倫多大學(xué)的教授,如今被聘為“Google大腦”的負(fù)責(zé)人。右邊的是Yann LeCun, 紐約大學(xué)教授,如今是Facebook人工智能實驗室的主任。而左邊的大家都很熟悉,Andrew Ng,中文名吳恩達(dá),斯坦福大學(xué)副教授,如今也是“百度大腦”的負(fù)責(zé)人與百度首席科學(xué)家。這三位都是目前業(yè)界炙手可熱的大牛,被互聯(lián)網(wǎng)界大鱷求賢若渴的聘請,足見他們的重要性。而他們的研究方向,則全部都是機(jī)器學(xué)習(xí)的子類--深度學(xué)習(xí)。下圖是圖二:

圖2語音助手產(chǎn)品

這幅圖上描述的是什么?Windows Phone上的語音助手Cortana,名字來源于《光環(huán)》中士官長的助手。相比其他競爭對手,微軟很遲才推出這個服務(wù)。Cortana背后的核心技術(shù)是什么,為什么它能夠聽懂人的語音?事實上,這個技術(shù)正是機(jī)器學(xué)習(xí)。機(jī)器學(xué)習(xí)是所有語音助手產(chǎn)品(包括Apple的siri與Google的Now)能夠跟人交互的關(guān)鍵技術(shù)。

通過上面兩圖,我相信大家可以看出機(jī)器學(xué)習(xí)似乎是一個很重要的,有很多未知特性的技術(shù)。學(xué)習(xí)它似乎是一件有趣的任務(wù)。實際上,學(xué)習(xí)機(jī)器學(xué)習(xí)不僅可以幫助我們了解互聯(lián)網(wǎng)界最新的趨勢,同時也可以知道伴隨我們的便利服務(wù)的實現(xiàn)技術(shù)。

機(jī)器學(xué)習(xí)是什么,為什么它能有這么大的魔力,這些問題正是本文要回答的。同時,本文叫做“從機(jī)器學(xué)習(xí)談起”,因此會以漫談的形式介紹跟機(jī)器學(xué)習(xí)相關(guān)的所有內(nèi)容,包括學(xué)科(如數(shù)據(jù)挖掘、計算機(jī)視覺等),算法(神經(jīng)網(wǎng)絡(luò),svm)等等。本文的主要目錄如下:1.一個故事說明什么是機(jī)器學(xué)習(xí)2.機(jī)器學(xué)習(xí)的定義3.機(jī)器學(xué)習(xí)的范圍4.機(jī)器學(xué)習(xí)的方法5.機(jī)器學(xué)習(xí)的應(yīng)用--大數(shù)據(jù)6.機(jī)器學(xué)習(xí)的子類--深度學(xué)習(xí)7.機(jī)器學(xué)習(xí)的父類--人工智能8.機(jī)器學(xué)習(xí)的思考--計算機(jī)的潛意識9.總結(jié)10.后記

1.一個故事說明什么是機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)這個詞是讓人疑惑的,首先它是英文名稱Machine Learning(簡稱ML)的直譯,在計算界Machine一般指計算機(jī)。這個名字使用了擬人的手法,說明了這門技術(shù)是讓機(jī)器“學(xué)習(xí)”的技術(shù)。但是計算機(jī)是死的,怎么可能像人類一樣“學(xué)習(xí)”呢?傳統(tǒng)上如果我們想讓計算機(jī)工作,我們給它一串指令,然后它遵照這個指令一步步執(zhí)行下去。有因有果,非常明確。但這樣的方式在機(jī)器學(xué)習(xí)中行不通。機(jī)器學(xué)習(xí)根本不接受你輸入的指令,相反,它接受你輸入的數(shù)據(jù)! 也就是說,機(jī)器學(xué)習(xí)是一種讓計算機(jī)利用數(shù)據(jù)而不是指令來進(jìn)行各種工作的方法。這聽起來非常不可思議,但結(jié)果上卻是非常可行的。“統(tǒng)計”思想將在你學(xué)習(xí)“機(jī)器學(xué)習(xí)”相關(guān)理念時無時無刻不伴隨,相關(guān)而不是因果的概念將是支撐機(jī)器學(xué)習(xí)能夠工作的核心概念。你會顛覆對你以前所有程序中建立的因果無處不在的根本理念。下面我通過一個故事來簡單地闡明什么是機(jī)器學(xué)習(xí)。這個故事比較適合用在知乎上作為一個概念的闡明。在這里,這個故事沒有展開,但相關(guān)內(nèi)容與核心是存在的。如果你想簡單的了解一下什么是機(jī)器學(xué)習(xí),那么看完這個故事就足夠了。如果你想了解機(jī)器學(xué)習(xí)的更多知識以及與它關(guān)聯(lián)緊密的當(dāng)代技術(shù),那么請你繼續(xù)往下看,后面有更多的豐富的內(nèi)容。這個例子來源于我真實的生活經(jīng)驗,我在思考這個問題的時候突然發(fā)現(xiàn)它的過程可以被擴(kuò)充化為一個完整的機(jī)器學(xué)習(xí)的過程,因此我決定使用這個例子作為所有介紹的開始。這個故事稱為“等人問題”。我相信大家都有跟別人相約,然后等人的經(jīng)歷。現(xiàn)實中不是每個人都那么守時的,于是當(dāng)你碰到一些愛遲到的人,你的時間不可避免的要浪費。我就碰到過這樣的一個例子。對我的一個朋友小Y而言,他就不是那么守時,最常見的表現(xiàn)是他經(jīng)常遲到。當(dāng)有一次我跟他約好3點鐘在某個麥當(dāng)勞見面時,在我出門的那一刻我突然想到一個問題:我現(xiàn)在出發(fā)合適么?我會不會又到了地點后,花上30分鐘去等他?我決定采取一個策略解決這個問題。要想解決這個問題,有好幾種方法。第一種方法是采用知識:我搜尋能夠解決這個問題的知識。但很遺憾,沒有人會把如何等人這個問題作為知識傳授,因此我不可能找到已有的知識能夠解決這個問題。第二種方法是問他人:我去詢問他人獲得解決這個問題的能力。但是同樣的,這個問題沒有人能夠解答,因為可能沒人碰上跟我一樣的情況。第三種方法是準(zhǔn)則法:我問自己的內(nèi)心,我有否設(shè)立過什么準(zhǔn)則去面對這個問題?例如,無論別人如何,我都會守時到達(dá)。但我不是個死板的人,我沒有設(shè)立過這樣的規(guī)則。事實上,我相信有種方法比以上三種都合適。我把過往跟小Y相約的經(jīng)歷在腦海中重現(xiàn)一下,看看跟他相約的次數(shù)中,遲到占了多大的比例。而我利用這來預(yù)測他這次遲到的可能性。如果這個值超出了我心里的某個界限,那我選擇等一會再出發(fā)。假設(shè)我跟小Y約過5次,他遲到的次數(shù)是1次,那么他按時到的比例為80%,我心中的閾值為70%,我認(rèn)為這次小Y應(yīng)該不會遲到,因此我按時出門。如果小Y在5次遲到的次數(shù)中占了4次,也就是他按時到達(dá)的比例為20%,由于這個值低于我的閾值,因此我選擇推遲出門的時間。這個方法從它的利用層面來看,又稱為經(jīng)驗法。在經(jīng)驗法的思考過程中,我事實上利用了以往所有相約的數(shù)據(jù)。因此也可以稱之為依據(jù)數(shù)據(jù)做的判斷。依據(jù)數(shù)據(jù)所做的判斷跟機(jī)器學(xué)習(xí)的思想根本上是一致的。剛才的思考過程我只考慮“頻次”這種屬性。在真實的機(jī)器學(xué)習(xí)中,這可能都不算是一個應(yīng)用。一般的機(jī)器學(xué)習(xí)模型至少考慮兩個量:一個是因變量,也就是我們希望預(yù)測的結(jié)果,在這個例子里就是小Y遲到與否的判斷。另一個是自變量,也就是用來預(yù)測小Y是否遲到的量。假設(shè)我把時間作為自變量,譬如我發(fā)現(xiàn)小Y所有遲到的日子基本都是星期五,而在非星期五情況下他基本不遲到。于是我可以建立一個模型,來模擬小Y遲到與否跟日子是否是星期五的概率。見下圖:

圖3 決策樹模型

這樣的圖就是一個最簡單的機(jī)器學(xué)習(xí)模型,稱之為決策樹。當(dāng)我們考慮的自變量只有一個時,情況較為簡單。如果把我們的自變量再增加一個。例如小Y遲到的部分情況時是在他開車過來的時候(你可以理解為他開車水平較臭,或者路較堵)。于是我可以關(guān)聯(lián)考慮這些信息。建立一個更復(fù)雜的模型,這個模型包含兩個自變量與一個因變量。再更復(fù)雜一點,小Y的遲到跟天氣也有一定的原因,例如下雨的時候,這時候我需要考慮三個自變量。如果我希望能夠預(yù)測小Y遲到的具體時間,我可以把他每次遲到的時間跟雨量的大小以及前面考慮的自變量統(tǒng)一建立一個模型。于是我的模型可以預(yù)測值,例如他大概會遲到幾分鐘。這樣可以幫助我更好的規(guī)劃我出門的時間。在這樣的情況下,決策樹就無法很好地支撐了,因為決策樹只能預(yù)測離散值。我們可以用節(jié)2所介紹的線型回歸方法建立這個模型。如果我把這些建立模型的過程交給電腦。比如把所有的自變量和因變量輸入,然后讓計算機(jī)幫我生成一個模型,同時讓計算機(jī)根據(jù)我當(dāng)前的情況,給出我是否需要遲出門,需要遲幾分鐘的建議。那么計算機(jī)執(zhí)行這些輔助決策的過程就是機(jī)器學(xué)習(xí)的過程。機(jī)器學(xué)習(xí)方法是計算機(jī)利用已有的數(shù)據(jù)(經(jīng)驗),得出了某種模型(遲到的規(guī)律),并利用此模型預(yù)測未來(是否遲到)的一種方法。通過上面的分析,可以看出機(jī)器學(xué)習(xí)與人類思考的經(jīng)驗過程是類似的,不過它能考慮更多的情況,執(zhí)行更加復(fù)雜的計算。事實上,機(jī)器學(xué)習(xí)的一個主要目的就是把人類思考?xì)w納經(jīng)驗的過程轉(zhuǎn)化為計算機(jī)通過對數(shù)據(jù)的處理計算得出模型的過程。經(jīng)過計算機(jī)得出的模型能夠以近似于人的方式解決很多靈活復(fù)雜的問題。下面,我會開始對機(jī)器學(xué)習(xí)的正式介紹,包括定義、范圍,方法、應(yīng)用等等,都有所包含。

2.機(jī)器學(xué)習(xí)的定義從廣義上來說,機(jī)器學(xué)習(xí)是一種能夠賦予機(jī)器學(xué)習(xí)的能力以此讓它完成直接編程無法完成的功能的方法。但從實踐的意義上來說,機(jī)器學(xué)習(xí)是一種通過利用數(shù)據(jù),訓(xùn)練出模型,然后使用模型預(yù)測的一種方法。

讓我們具體看一個例子。

圖4 房價的例子

拿國民話題的房子來說。現(xiàn)在我手里有一棟房子需要售賣,我應(yīng)該給它標(biāo)上多大的價格?房子的面積是100平方米,價格是100萬,120萬,還是140萬?

很顯然,我希望獲得房價與面積的某種規(guī)律。那么我該如何獲得這個規(guī)律?用報紙上的房價平均數(shù)據(jù)么?還是參考別人面積相似的?無論哪種,似乎都并不是太靠譜。

我現(xiàn)在希望獲得一個合理的,并且能夠最大程度的反映面積與房價關(guān)系的規(guī)律。于是我調(diào)查了周邊與我房型類似的一些房子,獲得一組數(shù)據(jù)。這組數(shù)據(jù)中包含了大大小小房子的面積與價格,如果我能從這組數(shù)據(jù)中找出面積與價格的規(guī)律,那么我就可以得出房子的價格。

對規(guī)律的尋找很簡單,擬合出一條直線,讓它“穿過”所有的點,并且與各個點的距離盡可能的小。

通過這條直線,我獲得了一個能夠最佳反映房價與面積規(guī)律的規(guī)律。這條直線同時也是一個下式所表明的函數(shù):

房價 = 面積 * a + b

上述中的a、b都是直線的參數(shù)。獲得這些參數(shù)以后,我就可以計算出房子的價格。

假設(shè)a = 0.75,b = 50,則房價 = 100 * 0.75 + 50 = 125萬。這個結(jié)果與我前面所列的100萬,120萬,140萬都不一樣。由于這條直線綜合考慮了大部分的情況,因此從“統(tǒng)計”意義上來說,這是一個最合理的預(yù)測。在求解過程中透露出了兩個信息:1.房價模型是根據(jù)擬合的函數(shù)類型決定的。如果是直線,那么擬合出的就是直線方程。如果是其他類型的線,例如拋物線,那么擬合出的就是拋物線方程。機(jī)器學(xué)習(xí)有眾多算法,一些強(qiáng)力算法可以擬合出復(fù)雜的非線性模型,用來反映一些不是直線所能表達(dá)的情況。2.如果我的數(shù)據(jù)越多,我的模型就越能夠考慮到越多的情況,由此對于新情況的預(yù)測效果可能就越好。這是機(jī)器學(xué)習(xí)界“數(shù)據(jù)為王”思想的一個體現(xiàn)。一般來說(不是絕對),數(shù)據(jù)越多,最后機(jī)器學(xué)習(xí)生成的模型預(yù)測的效果越好。

通過我擬合直線的過程,我們可以對機(jī)器學(xué)習(xí)過程做一個完整的回顧。首先,我們需要在計算機(jī)中存儲歷史的數(shù)據(jù)。接著,我們將這些 數(shù)據(jù)通過機(jī)器學(xué)習(xí)算法進(jìn)行處理,這個過程在機(jī)器學(xué)習(xí)中叫做“訓(xùn)練”,處理的結(jié)果可以被我們用來對新的數(shù)據(jù)進(jìn)行預(yù)測,這個結(jié)果一般稱之為“模型”。對新數(shù)據(jù) 的預(yù)測過程在機(jī)器學(xué)習(xí)中叫做“預(yù)測”。“訓(xùn)練”與“預(yù)測”是機(jī)器學(xué)習(xí)的兩個過程,“模型”則是過程的中間輸出結(jié)果,“訓(xùn)練”產(chǎn)生“模型”,“模型”指導(dǎo) “預(yù)測”。

讓我們把機(jī)器學(xué)習(xí)的過程與人類對歷史經(jīng)驗歸納的過程做個比對。

圖5機(jī)器學(xué)習(xí)與人類思考的類比

人類在成長、生活過程中積累了很多的歷史與經(jīng)驗。人類定期地對這些經(jīng)驗進(jìn)行“歸納”,獲得了生活的“規(guī)律”。當(dāng)人類遇到未知的問題或者需要對未來進(jìn)行“推測”的時候,人類使用這些“規(guī)律”,對未知問題與未來進(jìn)行“推測”,從而指導(dǎo)自己的生活和工作。

機(jī)器學(xué)習(xí)中的“訓(xùn)練”與“預(yù)測”過程可以對應(yīng)到人類的“歸納”和“推測”過程。通過這樣的對應(yīng),我們可以發(fā)現(xiàn),機(jī)器學(xué)習(xí)的思想并不復(fù)雜,僅僅是對人類在生活中學(xué)習(xí)成長的一個模擬。由于機(jī)器學(xué)習(xí)不是基于編程形成的結(jié)果,因此它的處理過程不是因果的邏輯,而是通過歸納思想得出的相關(guān)性結(jié)論。

這也可以聯(lián)想到人類為什么要學(xué)習(xí)歷史,歷史實際上是人類過往經(jīng)驗的總結(jié)。有句話說得很好,“歷史往往不一樣,但歷史總是驚人的相似”。通過學(xué)習(xí)歷史,我們從歷史中歸納出人生與國家的規(guī)律,從而指導(dǎo)我們的下一步工作,這是具有莫大價值的。當(dāng)代一些人忽視了歷史的本來價值,而是把其作為一種宣揚(yáng)功績的手段,這其實是對歷史真實價值的一種誤用。

3.機(jī)器學(xué)習(xí)的范圍

上文雖然說明了機(jī)器學(xué)習(xí)是什么,但是并沒有給出機(jī)器學(xué)習(xí)的范圍。

其實,機(jī)器學(xué)習(xí)跟模式識別,統(tǒng)計學(xué)習(xí),數(shù)據(jù)挖掘,計算機(jī)視覺,語音識別,自然語言處理等領(lǐng)域有著很深的聯(lián)系。

從范圍上來說,機(jī)器學(xué)習(xí)跟模式識別,統(tǒng)計學(xué)習(xí),數(shù)據(jù)挖掘是類似的,同時,機(jī)器學(xué)習(xí)與其他領(lǐng)域的處理技術(shù)的結(jié)合,形成了計算機(jī)視覺、語音識別、自然語言處理等交叉學(xué)科。因此,一般說數(shù)據(jù)挖掘時,可以等同于說機(jī)器學(xué)習(xí)。同時,我們平常所說的機(jī)器學(xué)習(xí)應(yīng)用,應(yīng)該是通用的,不僅僅局限在結(jié)構(gòu)化數(shù)據(jù),還有圖像,音頻等應(yīng)用。在這節(jié)對機(jī)器學(xué)習(xí)這些相關(guān)領(lǐng)域的介紹有助于我們理清機(jī)器學(xué)習(xí)的應(yīng)用場景與研究范圍,更好的理解后面的算法與應(yīng)用層次。

下圖是機(jī)器學(xué)習(xí)所牽扯的一些相關(guān)范圍的學(xué)科與研究領(lǐng)域。

圖6 機(jī)器學(xué)習(xí)與相關(guān)學(xué)科

模式識別模式識別=機(jī)器學(xué)習(xí)。兩者的主要區(qū)別在于前者是從工業(yè)界發(fā)展起來的概念,后者則主要源自計算機(jī)學(xué)科。在著名的《Pattern Recognition And Machine Learning》這本書中,Christopher M. Bishop在開頭是這樣說的“模式識別源自工業(yè)界,而機(jī)器學(xué)習(xí)來自于計算機(jī)學(xué)科。不過,它們中的活動可以被視為同一個領(lǐng)域的兩個方面,同時在過去的10年間,它們都有了長足的發(fā)展”。數(shù)據(jù)挖掘數(shù)據(jù)挖掘=機(jī)器學(xué)習(xí)+數(shù)據(jù)庫。這幾年數(shù)據(jù)挖掘的概念實在是太耳熟能詳。幾乎等同于炒作。但凡說數(shù)據(jù)挖掘都會吹噓數(shù)據(jù)挖掘如何如何,例如從數(shù)據(jù)中挖出金子,以及將廢棄的數(shù)據(jù)轉(zhuǎn)化為價值等等。但是,我盡管可能會挖出金子,但我也可能挖的是“石頭”啊。這個說法的意思是,數(shù)據(jù)挖掘僅僅是一種思考方式,告訴我們應(yīng)該嘗試從數(shù)據(jù)中挖掘出知識,但不是每個數(shù)據(jù)都能挖掘出金子的,所以不要神話它。一個系統(tǒng)絕對不會因為上了一個數(shù)據(jù)挖掘模塊就變得無所不能(這是IBM最喜歡吹噓的),恰恰相反,一個擁有數(shù)據(jù)挖掘思維的人員才是關(guān)鍵,而且他還必須對數(shù)據(jù)有深刻的認(rèn)識,這樣才可能從數(shù)據(jù)中導(dǎo)出模式指引業(yè)務(wù)的改善。大部分?jǐn)?shù)據(jù)挖掘中的算法是機(jī)器學(xué)習(xí)的算法在數(shù)據(jù)庫中的優(yōu)化。統(tǒng)計學(xué)習(xí)統(tǒng)計學(xué)習(xí)近似等于機(jī)器學(xué)習(xí)。統(tǒng)計學(xué)習(xí)是個與機(jī)器學(xué)習(xí)高度重疊的學(xué)科。因為機(jī)器學(xué)習(xí)中的大多數(shù)方法來自統(tǒng)計學(xué),甚至可以認(rèn)為,統(tǒng)計學(xué)的發(fā)展促進(jìn)機(jī)器學(xué)習(xí)的繁榮昌盛。例如著名的支持向量機(jī)算法,就是源自統(tǒng)計學(xué)科。但是在某種程度上兩者是有分別的,這個分別在于:統(tǒng)計學(xué)習(xí)者重點關(guān)注的是統(tǒng)計模型的發(fā)展與優(yōu)化,偏數(shù)學(xué),而機(jī)器學(xué)習(xí)者更關(guān)注的是能夠解決問題,偏實踐,因此機(jī)器學(xué)習(xí)研究者會重點研究學(xué)習(xí)算法在計算機(jī)上執(zhí)行的效率與準(zhǔn)確性的提升。計算機(jī)視覺計算機(jī)視覺=圖像處理+機(jī)器學(xué)習(xí)。圖像處理技術(shù)用于將圖像處理為適合進(jìn)入機(jī)器學(xué)習(xí)模型中的輸入,機(jī)器學(xué)習(xí)則負(fù)責(zé)從圖像中識別出相關(guān)的模式。計算機(jī)視覺相關(guān)的應(yīng)用非常的多,例如百度識圖、手寫字符識別、車牌識別等等應(yīng)用。這個領(lǐng)域是應(yīng)用前景非常火熱的,同時也是研究的熱門方向。隨著機(jī)器學(xué)習(xí)的新領(lǐng)域深度學(xué)習(xí)的發(fā)展,大大促進(jìn)了計算機(jī)圖像識別的效果,因此未來計算機(jī)視覺界的發(fā)展前景不可估量。語音識別語音識別=語音處理+機(jī)器學(xué)習(xí)。語音識別就是音頻處理技術(shù)與機(jī)器學(xué)習(xí)的結(jié)合。語音識別技術(shù)一般不會單獨使用,一般會結(jié)合自然語言處理的相關(guān)技術(shù)。目前的相關(guān)應(yīng)用有蘋果的語音助手siri等。自然語言處理自然語言處理=文本處理+機(jī)器學(xué)習(xí)。自然語言處理技術(shù)主要是讓機(jī)器理解人類的語言的一門領(lǐng)域。在自然語言處理技術(shù)中,大量使用了編譯原理相關(guān)的技術(shù),例如詞法分析,語法分析等等,除此之外,在理解這個層面,則使用了語義理解,機(jī)器學(xué)習(xí)等技術(shù)。作為唯一由人類自身創(chuàng)造的符號,自然語言處理一直是機(jī)器學(xué)習(xí)界不斷研究的方向。按照百度機(jī)器學(xué)習(xí)專家余凱的說法“聽與看,說白了就是阿貓和阿狗都會的,而只有語言才是人類獨有的”。如何利用機(jī)器學(xué)習(xí)技術(shù)進(jìn)行自然語言的的深度理解,一直是工業(yè)和學(xué)術(shù)界關(guān)注的焦點。可以看出機(jī)器學(xué)習(xí)在眾多領(lǐng)域的外延和應(yīng)用。機(jī)器學(xué)習(xí)技術(shù)的發(fā)展促使了很多智能領(lǐng)域的進(jìn)步,改善著我們的生活。

4.機(jī)器學(xué)習(xí)的方法

通過上節(jié)的介紹我們知曉了機(jī)器學(xué)習(xí)的大致范圍,那么機(jī)器學(xué)習(xí)里面究竟有多少經(jīng)典的算法呢?在這個部分我會簡要介紹一下機(jī)器學(xué)習(xí)中的經(jīng)典代表方法。這部分介紹的重點是這些方法內(nèi)涵的思想,數(shù)學(xué)與實踐細(xì)節(jié)不會在這討論。1、回歸算法

在大部分機(jī)器學(xué)習(xí)課程中,回歸算法都是介紹的第一個算法。原因有兩個:一.回歸算法比較簡單,介紹它可以讓人平滑地從統(tǒng)計學(xué)遷移到機(jī)器學(xué)習(xí)中。二.回歸算法是后面若干強(qiáng)大算法的基石,如果不理解回歸算法,無法學(xué)習(xí)那些強(qiáng)大的算法。回歸算法有兩個重要的子類:即線性回歸和邏輯回歸。

線性回歸就是我們前面說過的房價求解問題。如何擬合出一條直線最佳匹配我所有的數(shù)據(jù)?一般使用“最小二乘法”來求解。“最小二乘法”的思想是這樣的,假設(shè)我們擬合出的直線代表數(shù)據(jù)的真實值,而觀測到的數(shù)據(jù)代表擁有誤差的值。為了盡可能減小誤差的影響,需要求解一條直線使所有誤差的平方和最小。最小二乘法將最優(yōu)問題轉(zhuǎn)化為求函數(shù)極值問題。函數(shù)極值在數(shù)學(xué)上我們一般會采用求導(dǎo)數(shù)為0的方法。但這種做法并不適合計算機(jī),可能求解不出來,也可能計算量太大。

計算機(jī)科學(xué)界專門有一個學(xué)科叫“數(shù)值計算”,專門用來提升計算機(jī)進(jìn)行各類計算時的準(zhǔn)確性和效率問題。例如,著名的“梯度下降”以及“牛頓法”就是數(shù)值計算中的經(jīng)典算法,也非常適合來處理求解函數(shù)極值的問題。梯度下降法是解決回歸模型中最簡單且有效的方法之一。從嚴(yán)格意義上來說,由于后文中的神經(jīng)網(wǎng)絡(luò)和推薦算法中都有線性回歸的因子,因此梯度下降法在后面的算法實現(xiàn)中也有應(yīng)用。邏輯回歸是一種與線性回歸非常類似的算法,但是,從本質(zhì)上講,線型回歸處理的問題類型與邏輯回歸不一致。線性回歸處理的是數(shù)值問題,也就是最后預(yù)測出的結(jié)果是數(shù)字,例如房價。而邏輯回歸屬于分類算法,也就是說,邏輯回歸預(yù)測結(jié)果是離散的分類,例如判斷這封郵件是否是垃圾郵件,以及用戶是否會點擊此廣告等等。

實現(xiàn)方面的話,邏輯回歸只是對對線性回歸的計算結(jié)果加上了一個Sigmoid函數(shù),將數(shù)值結(jié)果轉(zhuǎn)化為了0到1之間的概率(Sigmoid函數(shù)的圖像一般來說并不直觀,你只需要理解對數(shù)值越大,函數(shù)越逼近1,數(shù)值越小,函數(shù)越逼近0),接著我們根據(jù)這個概率可以做預(yù)測,例如概率大于0.5,則這封郵件就是垃圾郵件,或者腫瘤是否是惡性的等等。從直觀上來說,邏輯回歸是畫出了一條分類線,見下圖。

圖7 邏輯回歸的直觀解釋

假設(shè)我們有一組腫瘤患者的數(shù)據(jù),這些患者的腫瘤中有些是良性的(圖中的藍(lán)色點),有些是惡性的(圖中的紅色點)。這里腫瘤的紅藍(lán)色可以被稱作數(shù)據(jù)的“標(biāo)簽”。同時每個數(shù)據(jù)包括兩個“特征”:患者的年齡與腫瘤的大小。我們將這兩個特征與標(biāo)簽映射到這個二維空間上,形成了我上圖的數(shù)據(jù)。當(dāng)我有一個綠色的點時,我該判斷這個腫瘤是惡性的還是良性的呢?根據(jù)紅藍(lán)點我們訓(xùn)練出了一個邏輯回歸模型,也就是圖中的分類線。這時,根據(jù)綠點出現(xiàn)在分類線的左側(cè),因此我們判斷它的標(biāo)簽應(yīng)該是紅色,也就是說屬于惡性腫瘤。邏輯回歸算法劃出的分類線基本都是線性的(也有劃出非線性分類線的邏輯回歸,不過那樣的模型在處理數(shù)據(jù)量較大的時候效率會很低),這意味著當(dāng)兩類之間的界線不是線性時,邏輯回歸的表達(dá)能力就不足。下面的兩個算法是機(jī)器學(xué)習(xí)界最強(qiáng)大且重要的算法,都可以擬合出非線性的分類線。2、神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)(也稱之為人工神經(jīng)網(wǎng)絡(luò),ANN)算法是80年代機(jī)器學(xué)習(xí)界非常流行的算法,不過在90年代中途衰落。現(xiàn)在,攜著“深度學(xué)習(xí)”之勢,神經(jīng)網(wǎng)絡(luò)重裝歸來,重新成為最強(qiáng)大的機(jī)器學(xué)習(xí)算法之一。神經(jīng)網(wǎng)絡(luò)的誕生起源于對大腦工作機(jī)理的研究。早期生物界學(xué)者們使用神經(jīng)網(wǎng)絡(luò)來模擬大腦。機(jī)器學(xué)習(xí)的學(xué)者們使用神經(jīng)網(wǎng)絡(luò)進(jìn)行機(jī)器學(xué)習(xí)的實驗,發(fā)現(xiàn)在視覺與語音的識別上效果都相當(dāng)好。在BP算法(加速神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程的數(shù)值算法)誕生以后,神經(jīng)網(wǎng)絡(luò)的發(fā)展進(jìn)入了一個熱潮。BP算法的發(fā)明人之一是前面介紹的機(jī)器學(xué)習(xí)大牛Geoffrey Hinton(圖1中的中間者)。具體說來,神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)機(jī)理是什么?簡單來說,就是分解與整合。在著名的Hubel-Wiesel試驗中,學(xué)者們研究貓的視覺分析機(jī)理是這樣的。

圖8 Hubel-Wiesel試驗與大腦視覺機(jī)理

比方說,一個正方形,分解為四個折線進(jìn)入視覺處理的下一層中。四個神經(jīng)元分別處理一個折線。每個折線再繼續(xù)被分解為兩條直線,每條直線再被分解為黑白兩個面。于是,一個復(fù)雜的圖像變成了大量的細(xì)節(jié)進(jìn)入神經(jīng)元,神經(jīng)元處理以后再進(jìn)行整合,最后得出了看到的是正方形的結(jié)論。這就是大腦視覺識別的機(jī)理,也是神經(jīng)網(wǎng)絡(luò)工作的機(jī)理。讓我們看一個簡單的神經(jīng)網(wǎng)絡(luò)的邏輯架構(gòu)。在這個網(wǎng)絡(luò)中,分成輸入層,隱藏層,和輸出層。輸入層負(fù)責(zé)接收信號,隱藏層負(fù)責(zé)對數(shù)據(jù)的分解與處理,最后的結(jié)果被整合到輸出層。每層中的一個圓代表一個處理單元,可以認(rèn)為是模擬了一個神經(jīng)元,若干個處理單元組成了一個層,若干個層再組成了一個網(wǎng)絡(luò),也就是"神經(jīng)網(wǎng)絡(luò)"。

圖9 神經(jīng)網(wǎng)絡(luò)的邏輯架構(gòu)

在神經(jīng)網(wǎng)絡(luò)中,每個處理單元事實上就是一個邏輯回歸模型,邏輯回歸模型接收上層的輸入,把模型的預(yù)測結(jié)果作為輸出傳輸?shù)较乱粋€層次。通過這樣的過程,神經(jīng)網(wǎng)絡(luò)可以完成非常復(fù)雜的非線性分類。

下圖會演示神經(jīng)網(wǎng)絡(luò)在圖像識別領(lǐng)域的一個著名應(yīng)用,這個程序叫做LeNet,是一個基于多個隱層構(gòu)建的神經(jīng)網(wǎng)絡(luò)。通過LeNet可以識別多種手寫數(shù)字,并且達(dá)到很高的識別精度與擁有較好的魯棒性。

圖10 LeNet的效果展示

右下方的方形中顯示的是輸入計算機(jī)的圖像,方形上方的紅色字樣“answer”后面顯示的是計算機(jī)的輸出。左邊的三條豎直的圖像列顯示的是神經(jīng)網(wǎng)絡(luò)中三個隱藏層的輸出,可以看出,隨著層次的不斷深入,越深的層次處理的細(xì)節(jié)越低,例如層3基本處理的都已經(jīng)是線的細(xì)節(jié)了。LeNet的發(fā)明人就是前文介紹過的機(jī)器學(xué)習(xí)的大牛Yann LeCun(圖1右者)。

進(jìn)入90年代,神經(jīng)網(wǎng)絡(luò)的發(fā)展進(jìn)入了一個瓶頸期。其主要原因是盡管有BP算法的加速,神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程仍然很困難。因此90年代后期支持向量機(jī)(SVM)算法取代了神經(jīng)網(wǎng)絡(luò)的地位。3、SVM(支持向量機(jī))

支持向量機(jī)算法是誕生于統(tǒng)計學(xué)習(xí)界,同時在機(jī)器學(xué)習(xí)界大放光彩的經(jīng)典算法。

支持向量機(jī)算法從某種意義上來說是邏輯回歸算法的強(qiáng)化:通過給予邏輯回歸算法更嚴(yán)格的優(yōu)化條件,支持向量機(jī)算法可以獲得比邏輯回歸更好的分類界線。但是如果沒有某類函數(shù)技術(shù),則支持向量機(jī)算法最多算是一種更好的線性分類技術(shù)。

但是,通過跟高斯“核”的結(jié)合,支持向量機(jī)可以表達(dá)出非常復(fù)雜的分類界線,從而達(dá)成很好的的分類效果。“核”事實上就是一種特殊的函數(shù),最典型的特征就是可以將低維的空間映射到高維的空間。

例如下圖所示:

圖11 支持向量機(jī)圖例

我們?nèi)绾卧诙S平面劃分出一個圓形的分類界線?在二維平面可能會很困難,但是通過“核”可以將二維空間映射到三維空間,然后使用一個線性平面就可以達(dá)成類似效果。也就是說,二維平面劃分出的非線性分類界線可以等價于三維平面的線性分類界線。于是,我們可以通過在三維空間中進(jìn)行簡單的線性劃分就可以達(dá)到在二維平面中的非線性劃分效果。

圖12 三維空間的切割

支持向量機(jī)是一種數(shù)學(xué)成分很濃的機(jī)器學(xué)習(xí)算法(相對的,神經(jīng)網(wǎng)絡(luò)則有生物科學(xué)成分)。在算法的核心步驟中,有一步證明,即將數(shù)據(jù)從低維映射到高維不會帶來最后計算復(fù)雜性的提升。于是,通過支持向量機(jī)算法,既可以保持計算效率,又可以獲得非常好的分類效果。因此支持向量機(jī)在90年代后期一直占據(jù)著機(jī)器學(xué)習(xí)中最核心的地位,基本取代了神經(jīng)網(wǎng)絡(luò)算法。直到現(xiàn)在神經(jīng)網(wǎng)絡(luò)借著深度學(xué)習(xí)重新興起,兩者之間才又發(fā)生了微妙的平衡轉(zhuǎn)變。4、聚類算法

前面的算法中的一個顯著特征就是我的訓(xùn)練數(shù)據(jù)中包含了標(biāo)簽,訓(xùn)練出的模型可以對其他未知數(shù)據(jù)預(yù)測標(biāo)簽。在下面的算法中,訓(xùn)練數(shù)據(jù)都是不含標(biāo)簽的,而算法的目的則是通過訓(xùn)練,推測出這些數(shù)據(jù)的標(biāo)簽。這類算法有一個統(tǒng)稱,即無監(jiān)督算法(前面有標(biāo)簽的數(shù)據(jù)的算法則是有監(jiān)督算法)。無監(jiān)督算法中最典型的代表就是聚類算法。讓我們還是拿一個二維的數(shù)據(jù)來說,某一個數(shù)據(jù)包含兩個特征。我希望通過聚類算法,給他們中不同的種類打上標(biāo)簽,我該怎么做呢?簡單來說,聚類算法就是計算種群中的距離,根據(jù)距離的遠(yuǎn)近將數(shù)據(jù)劃分為多個族群。聚類算法中最典型的代表就是K-Means算法。

5、降維算法

降維算法也是一種無監(jiān)督學(xué)習(xí)算法,其主要特征是將數(shù)據(jù)從高維降低到低維層次。在這里,維度其實表示的是數(shù)據(jù)的特征量的大小,例如,房價包含房子的長、寬、面積與房間數(shù)量四個特征,也就是維度為4維的數(shù)據(jù)。可以看出來,長與寬事實上與面積表示的信息重疊了,例如面積=長 × 寬。通過降維算法我們就可以去除冗余信息,將特征減少為面積與房間數(shù)量兩個特征,即從4維的數(shù)據(jù)壓縮到2維。于是我們將數(shù)據(jù)從高維降低到低維,不僅利于表示,同時在計算上也能帶來加速。剛才說的降維過程中減少的維度屬于肉眼可視的層次,同時壓縮也不會帶來信息的損失(因為信息冗余了)。如果肉眼不可視,或者沒有冗余的特征,降維算法也能工作,不過這樣會帶來一些信息的損失。但是,降維算法可以從數(shù)學(xué)上證明,從高維壓縮到的低維中最大程度地保留了數(shù)據(jù)的信息。因此,使用降維算法仍然有很多的好處。降維算法的主要作用是壓縮數(shù)據(jù)與提升機(jī)器學(xué)習(xí)其他算法的效率。通過降維算法,可以將具有幾千個特征的數(shù)據(jù)壓縮至若干個特征。另外,降維算法的另一個好處是數(shù)據(jù)的可視化,例如將5維的數(shù)據(jù)壓縮至2維,然后可以用二維平面來可視。降維算法的主要代表是PCA算法(即主成分分析算法)。6、推薦算法

推薦算法是目前業(yè)界非常火的一種算法,在電商界,如亞馬遜,天貓,京東等得到了廣泛的運用。推薦算法的主要特征就是可以自動向用戶推薦他們最感興趣的東西,從而增加購買率,提升效益。推薦算法有兩個主要的類別:

一類是基于物品內(nèi)容的推薦,是將與用戶購買的內(nèi)容近似的物品推薦給用戶,這樣的前提是每個物品都得有若干個標(biāo)簽,因此才可以找出與用戶購買物品類似的物品,這樣推薦的好處是關(guān)聯(lián)程度較大,但是由于每個物品都需要貼標(biāo)簽,因此工作量較大。

另一類是基于用戶相似度的推薦,則是將與目標(biāo)用戶興趣相同的其他用戶購買的東西推薦給目標(biāo)用戶,例如小A歷史上買了物品B和C,經(jīng)過算法分析,發(fā)現(xiàn)另一個與小A近似的用戶小D購買了物品E,于是將物品E推薦給小A。

兩類推薦都有各自的優(yōu)缺點,在一般的電商應(yīng)用中,一般是兩類混合使用。推薦算法中最有名的算法就是協(xié)同過濾算法。7、其他

除了以上算法之外,機(jī)器學(xué)習(xí)界還有其他的如高斯判別,樸素貝葉斯,決策樹等等算法。但是上面列的六個算法是使用最多,影響最廣,種類最全的典型。機(jī)器學(xué)習(xí)界的一個特色就是算法眾多,發(fā)展百花齊放。下面做一個總結(jié),按照訓(xùn)練的數(shù)據(jù)有無標(biāo)簽,可以將上面算法分為監(jiān)督學(xué)習(xí)算法和無監(jiān)督學(xué)習(xí)算法,但推薦算法較為特殊,既不屬于監(jiān)督學(xué)習(xí),也不屬于非監(jiān)督學(xué)習(xí),是單獨的一類。

監(jiān)督學(xué)習(xí)算法:線性回歸,邏輯回歸,神經(jīng)網(wǎng)絡(luò),SVM無監(jiān)督學(xué)習(xí)算法:聚類算法,降維算法特殊算法:推薦算法

除了這些算法以外,有一些算法的名字在機(jī)器學(xué)習(xí)領(lǐng)域中也經(jīng)常出現(xiàn)。但他們本身并不算是一個機(jī)器學(xué)習(xí)算法,而是為了解決某個子問題而誕生的。你可以理解他們?yōu)橐陨纤惴ǖ淖铀惴ǎ糜诖蠓忍岣哂?xùn)練過程。其中的代表有:梯度下降法,主要運用在線型回歸,邏輯回歸,神經(jīng)網(wǎng)絡(luò),推薦算法中;牛頓法,主要運用在線型回歸中;BP算法,主要運用在神經(jīng)網(wǎng)絡(luò)中;SMO算法,主要運用在SVM中。

5.機(jī)器學(xué)習(xí)的應(yīng)用--大數(shù)據(jù)說完機(jī)器學(xué)習(xí)的方法,下面要談一談機(jī)器學(xué)習(xí)的應(yīng)用了。無疑,在2010年以前,機(jī)器學(xué)習(xí)的應(yīng)用在某些特定領(lǐng)域發(fā)揮了巨大的作用,如車牌識別,網(wǎng)絡(luò)攻擊防范,手寫字符識別等等。但是,從2010年以后,隨著大數(shù)據(jù)概念的興起,機(jī)器學(xué)習(xí)大量的應(yīng)用都與大數(shù)據(jù)高度耦合,幾乎可以認(rèn)為大數(shù)據(jù)是機(jī)器學(xué)習(xí)應(yīng)用的最佳場景。譬如,但凡你能找到的介紹大數(shù)據(jù)魔力的文章,都會說大數(shù)據(jù)如何準(zhǔn)確準(zhǔn)確預(yù)測到了某些事。例如經(jīng)典的Google利用大數(shù)據(jù)預(yù)測了H1N1在美國某小鎮(zhèn)的爆發(fā)。

圖13 Google成功預(yù)測H1N1

百度預(yù)測2014年世界杯,從淘汰賽到?jīng)Q賽全部預(yù)測正確。

圖14 百度世界杯成功預(yù)測了所有比賽結(jié)果

這些實在太神奇了,那么究竟是什么原因?qū)е麓髷?shù)據(jù)具有這些魔力的呢?簡單來說,就是機(jī)器學(xué)習(xí)技術(shù)。正是基于機(jī)器學(xué)習(xí)技術(shù)的應(yīng)用,數(shù)據(jù)才能發(fā)揮其魔力。

大數(shù)據(jù)的核心是利用數(shù)據(jù)的價值,機(jī)器學(xué)習(xí)是利用數(shù)據(jù)價值的關(guān)鍵技術(shù),對于大數(shù)據(jù)而言,機(jī)器學(xué)習(xí)是不可或缺的。相反,對于機(jī)器學(xué)習(xí)而言,越多的數(shù)據(jù)會越 可能提升模型的精確性,同時,復(fù)雜的機(jī)器學(xué)習(xí)算法的計算時間也迫切需要分布式計算與內(nèi)存計算這樣的關(guān)鍵技術(shù)。因此,機(jī)器學(xué)習(xí)的興盛也離不開大數(shù)據(jù)的幫助。 大數(shù)據(jù)與機(jī)器學(xué)習(xí)兩者是互相促進(jìn),相依相存的關(guān)系。

機(jī)器學(xué)習(xí)與大數(shù)據(jù)緊密聯(lián)系。但是,必須清醒的認(rèn)識到,大數(shù)據(jù)并不等同于機(jī)器學(xué)習(xí),同理,機(jī)器學(xué)習(xí)也不等同于大數(shù)據(jù)。大數(shù)據(jù)中包含有分布式計算,內(nèi)存數(shù)據(jù)庫,多維分析等等多種技術(shù)。單從分析方法來看,大數(shù)據(jù)也包含以下四種分析方法:1.大數(shù)據(jù),小分析:即數(shù)據(jù)倉庫領(lǐng)域的OLAP分析思路,也就是多維分析思想。2.大數(shù)據(jù),大分析:這個代表的就是數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)分析法。3.流式分析:這個主要指的是事件驅(qū)動架構(gòu)。4.查詢分析:經(jīng)典代表是NoSQL數(shù)據(jù)庫。也就是說,機(jī)器學(xué)習(xí)僅僅是大數(shù)據(jù)分析中的一種而已。盡管機(jī)器學(xué)習(xí)的一些結(jié)果具有很大的魔力,在某種場合下是大數(shù)據(jù)價值最好的說明。但這并不代表機(jī)器學(xué)習(xí)是大數(shù)據(jù)下的唯一的分析方法。機(jī)器學(xué)習(xí)與大數(shù)據(jù)的結(jié)合產(chǎn)生了巨大的價值。基于機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,數(shù)據(jù)能夠“預(yù)測”。對人類而言,積累的經(jīng)驗越豐富,閱歷也廣泛,對未來的判斷越準(zhǔn)確。例如常說的“經(jīng)驗豐富”的人比“初出茅廬”的小伙子更有工作上的優(yōu)勢,就在于經(jīng)驗豐富的人獲得的規(guī)律比他人更準(zhǔn)確。而在機(jī)器學(xué)習(xí)領(lǐng)域,根據(jù)著名的一個實驗,有效的證實了機(jī)器學(xué)習(xí)界一個理論:即機(jī)器學(xué)習(xí)模型的數(shù)據(jù)越多,機(jī)器學(xué)習(xí)的預(yù)測的效率就越好。見下圖:

圖15 機(jī)器學(xué)習(xí)準(zhǔn)確率與數(shù)據(jù)的關(guān)系

通過這張圖可以看出,各種不同算法在輸入的數(shù)據(jù)量達(dá)到一定級數(shù)后,都有相近的高準(zhǔn)確度。于是誕生了機(jī)器學(xué)習(xí)界的名言:成功的機(jī)器學(xué)習(xí)應(yīng)用不是擁有最好的算法,而是擁有最多的數(shù)據(jù)!在大數(shù)據(jù)的時代,有好多優(yōu)勢促使機(jī)器學(xué)習(xí)能夠應(yīng)用更廣泛。例如隨著物聯(lián)網(wǎng)和移動設(shè)備的發(fā)展,我們擁有的數(shù)據(jù)越來越多,種類也包括圖片、文本、視頻等非結(jié)構(gòu)化數(shù)據(jù),這使得機(jī)器學(xué)習(xí)模型可以獲得越來越多的數(shù)據(jù)。同時大數(shù)據(jù)技術(shù)中的分布式計算Map-Reduce使得機(jī)器學(xué)習(xí)的速度越來越快,可以更方便的使用。種種優(yōu)勢使得在大數(shù)據(jù)時代,機(jī)器學(xué)習(xí)的優(yōu)勢可以得到最佳的發(fā)揮。

6.機(jī)器學(xué)習(xí)的子類--深度學(xué)習(xí)近來,機(jī)器學(xué)習(xí)的發(fā)展產(chǎn)生了一個新的方向,即“深度學(xué)習(xí)”。雖然深度學(xué)習(xí)這四字聽起來頗為高大上,但其理念卻非常簡單,就是傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)發(fā)展到了多隱藏層的情況。在上文介紹過,自從90年代以后,神經(jīng)網(wǎng)絡(luò)已經(jīng)消寂了一段時間。但是BP算法的發(fā)明人Geoffrey Hinton一直沒有放棄對神經(jīng)網(wǎng)絡(luò)的研究。由于神經(jīng)網(wǎng)絡(luò)在隱藏層擴(kuò)大到兩個以上,其訓(xùn)練速度就會非常慢,因此實用性一直低于支持向量機(jī)。2006年,Geoffrey Hinton在科學(xué)雜志《Science》上發(fā)表了一篇文章,論證了兩個觀點:

1.多隱層的神經(jīng)網(wǎng)絡(luò)具有優(yōu)異的特征學(xué)習(xí)能力,學(xué)習(xí)得到的特征對數(shù)據(jù)有更本質(zhì)的刻畫,從而有利于可視化或分類;

2.深度神經(jīng)網(wǎng)絡(luò)在訓(xùn)練上的難度,可以通過“逐層初始化” 來有效克服。

圖16Geoffrey Hinton與他的學(xué)生在Science上發(fā)表文章

通過這樣的發(fā)現(xiàn),不僅解決了神經(jīng)網(wǎng)絡(luò)在計算上的難度,同時也說明了深層神經(jīng)網(wǎng)絡(luò)在學(xué)習(xí)上的優(yōu)異性。從此,神經(jīng)網(wǎng)絡(luò)重新成為了機(jī)器學(xué)習(xí)界中的主流強(qiáng)大學(xué)習(xí)技術(shù)。同時,具有多個隱藏層的神經(jīng)網(wǎng)絡(luò)被稱為深度神經(jīng)網(wǎng)絡(luò),基于深度神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)研究稱之為深度學(xué)習(xí)。由于深度學(xué)習(xí)的重要性質(zhì),在各方面都取得極大的關(guān)注,按照時間軸排序,有以下四個標(biāo)志性事件值得一說:2012年6月,《紐約時報》披露了Google Brain項目,這個項目是由Andrew Ng和Map-Reduce發(fā)明人Jeff Dean共同主導(dǎo),用16000個CPU Core的并行計算平臺訓(xùn)練一種稱為“深層神經(jīng)網(wǎng)絡(luò)”的機(jī)器學(xué)習(xí)模型,在語音識別和圖像識別等領(lǐng)域獲得了巨大的成功。Andrew Ng就是文章開始所介紹的機(jī)器學(xué)習(xí)的大牛(圖1中左者)。

2012年11月,微軟在中國天津的一次活動上公開演示了一個全自動的同聲傳譯系統(tǒng),講演者用英文演講,后臺的計算機(jī)一氣呵成自動完成語音識別、英中機(jī)器翻譯,以及中文語音合成,效果非常流暢,其中支撐的關(guān)鍵技術(shù)是深度學(xué)習(xí);

2013年1月,在百度的年會上,創(chuàng)始人兼CEO李彥宏高調(diào)宣布要成立百度研究院,其中第一個重點方向就是深度學(xué)習(xí),并為此而成立深度學(xué)習(xí)研究院(IDL)。

2013年4月,《麻省理工學(xué)院技術(shù)評論》雜志將深度學(xué)習(xí)列為2013年十大突破性技術(shù)(Breakthrough Technology)之首。

圖17深度學(xué)習(xí)的發(fā)展熱潮

文章開頭所列的三位機(jī)器學(xué)習(xí)的大牛,不僅都是機(jī)器學(xué)習(xí)界的專家,更是深度學(xué)習(xí)研究領(lǐng)域的先驅(qū)。因此,使他們擔(dān)任各個大型互聯(lián)網(wǎng)公司技術(shù)掌舵者的原因不僅在于他們的技術(shù)實力,更在于他們研究的領(lǐng)域是前景無限的深度學(xué)習(xí)技術(shù)。目前業(yè)界許多的圖像識別技術(shù)與語音識別技術(shù)的進(jìn)步都源于深度學(xué)習(xí)的發(fā)展,除了本文開頭所提的Cortana等語音助手,還包括一些圖像識別應(yīng)用,其中典型的代表就是下圖的百度識圖功能。

圖18百度識圖

深度學(xué)習(xí)屬于機(jī)器學(xué)習(xí)的子類。基于深度學(xué)習(xí)的發(fā)展極大的促進(jìn)了機(jī)器學(xué)習(xí)的地位提高,更進(jìn)一步地,推動了業(yè)界對機(jī)器學(xué)習(xí)父類人工智能夢想的再次重視。

7.機(jī)器學(xué)習(xí)的父類--人工智能

人工智能是機(jī)器學(xué)習(xí)的父類。深度學(xué)習(xí)則是機(jī)器學(xué)習(xí)的子類。如果把三者的關(guān)系用圖來表明的話,則是下圖:

圖19深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、人工智能三者關(guān)系

毫無疑問,人工智能(AI)是人類所能想象的科技界最突破性的發(fā)明了,某種意義上來說,人工智能就像游戲最終幻想的名字一樣,是人類對于科技界的最終夢想。從50年代提出人工智能的理念以后,科技界,產(chǎn)業(yè)界不斷在探索,研究。這段時間各種小說、電影都在以各種方式展現(xiàn)對于人工智能的想象。人類可以發(fā)明類似于人類的機(jī)器,這是多么偉大的一種理念!但事實上,自從50年代以后,人工智能的發(fā)展就磕磕碰碰,未有見到足夠震撼的科學(xué)技術(shù)的進(jìn)步。總結(jié)起來,人工智能的發(fā)展經(jīng)歷了如下若干階段,從早期的邏輯推理,到中期的專家系統(tǒng),這些科研進(jìn)步確實使我們離機(jī)器的智能有點接近了,但還有一大段距離。直到機(jī)器學(xué)習(xí)誕生以后,人工智能界感覺終于找對了方向。基于機(jī)器學(xué)習(xí)的圖像識別和語音識別在某些垂直領(lǐng)域達(dá)到了跟人相媲美的程度。機(jī)器學(xué)習(xí)使人類第一次如此接近人工智能的夢想。

事實上,如果我們把人工智能相關(guān)的技術(shù)以及其他業(yè)界的技術(shù)做一個類比,就可以發(fā)現(xiàn)機(jī)器學(xué)習(xí)在人工智能中的重要地位不是沒有理由的。

人類區(qū)別于其他物體,植物,動物的最主要區(qū)別,作者認(rèn)為是“智慧”。而智慧的最佳體現(xiàn)是什么?

是計算能力么,應(yīng)該不是,心算速度快的人我們一般稱之為天才。是反應(yīng)能力么,也不是,反應(yīng)快的人我們稱之為靈敏。是記憶能力么,也不是,記憶好的人我們一般稱之為過目不忘。是推理能力么,這樣的人我也許會稱他智力很高,類似“福爾摩斯”,但不會稱他擁有智慧。是知識能力么,這樣的人我們稱之為博聞廣,也不會稱他擁有智慧。

想想看我們一般形容誰有大智慧?圣人,諸如莊子,老子等。智慧是對生活的感悟,是對人生的積淀與思考,這與我們機(jī)器學(xué)習(xí)的思想何其相似?通過經(jīng)驗獲取規(guī)律,指導(dǎo)人生與未來。沒有經(jīng)驗就沒有智慧。

圖20機(jī)器學(xué)習(xí)與智慧

那么,從計算機(jī)來看,以上的種種能力都有種種技術(shù)去應(yīng)對。

例如計算能力我們有分布式計算,反應(yīng)能力我們有事件驅(qū)動架構(gòu),檢索能力我們有搜索引擎,知識存儲能力我們有數(shù)據(jù)倉庫,邏輯推理能力我們有專家系統(tǒng),但是,唯有對應(yīng)智慧中最顯著特征的歸納與感悟能力,只有機(jī)器學(xué)習(xí)與之對應(yīng)。這也是機(jī)器學(xué)習(xí)能力最能表征智慧的根本原因。讓我們再看一下機(jī)器人的制造,在我們具有了強(qiáng)大的計算,海量的存儲,快速的檢索,迅速的反應(yīng),優(yōu)秀的邏輯推理后我們?nèi)绻倥浜仙弦粋€強(qiáng)大的智慧大腦,一個真正意義上的人工智能也許就會誕生,這也是為什么說在機(jī)器學(xué)習(xí)快速發(fā)展的現(xiàn)在,人工智能可能不再是夢想的原因。人工智能的發(fā)展可能不僅取決于機(jī)器學(xué)習(xí),更取決于前面所介紹的深度學(xué)習(xí),深度學(xué)習(xí)技術(shù)由于深度模擬了人類大腦的構(gòu)成,在視覺識別與語音識別上顯著性的突破了原有機(jī)器學(xué)習(xí)技術(shù)的界限,因此極有可能是真正實現(xiàn)人工智能夢想的關(guān)鍵技術(shù)。無論是谷歌大腦還是百度大腦,都是通過海量層次的深度學(xué)習(xí)網(wǎng)絡(luò)所構(gòu)成的。也許借助于深度學(xué)習(xí)技術(shù),在不遠(yuǎn)的將來,一個具有人類智能的計算機(jī)真的有可能實現(xiàn)。

最后再說一下題外話,由于人工智能借助于深度學(xué)習(xí)技術(shù)的快速發(fā)展,已經(jīng)在某些地方引起了傳統(tǒng)技術(shù)界達(dá)人的擔(dān)憂。真實世界的“鋼鐵俠”,特斯拉CEO馬斯克就是其中之一。最近馬斯克在參加MIT討論會時,就表達(dá)了對于人工智能的擔(dān)憂。“人工智能的研究就類似于召喚惡魔,我們必須在某些地方加強(qiáng)注意。”

圖21馬斯克與人工智能

盡管馬斯克的擔(dān)心有些危言聳聽,但是馬斯克的推理不無道理。“如果人工智能想要消除垃圾郵件的話,可能它最后的決定就是消滅人類。”馬斯克認(rèn)為預(yù)防此類現(xiàn)象的方法是引入政府的監(jiān)管。在這里作者的觀點與馬斯克類似,在人工智能誕生之初就給其加上若干規(guī)則限制可能有效,也就是不應(yīng)該使用單純的機(jī)器學(xué)習(xí),而應(yīng)該是機(jī)器學(xué)習(xí)與規(guī)則引擎等系統(tǒng)的綜合能夠較好的解決這類問題。因為如果學(xué)習(xí)沒有限制,極有可能進(jìn)入某個誤區(qū),必須要加上某些引導(dǎo)。正如人類社會中,法律就是一個最好的規(guī)則,殺人者死就是對于人類在探索提高生產(chǎn)力時不可逾越的界限。

在這里,必須提一下這里的規(guī)則與機(jī)器學(xué)習(xí)引出的規(guī)律的不同,規(guī)律不是一個嚴(yán)格意義的準(zhǔn)則,其代表的更多是概率上的指導(dǎo),而規(guī)則則是神圣不可侵犯,不可修改的。規(guī)律可以調(diào)整,但規(guī)則是不能改變的。有效的結(jié)合規(guī)律與規(guī)則的特點,可以引導(dǎo)出一個合理的,可控的學(xué)習(xí)型人工智能。

8.機(jī)器學(xué)習(xí)的思考--計算機(jī)的潛意識最后,作者想談一談關(guān)于機(jī)器學(xué)習(xí)的一些思考。主要是作者在日常生活總結(jié)出來的一些感悟。

回想一下我在節(jié)1里所說的故事,我把小Y過往跟我相約的經(jīng)歷做了一個羅列。但是這種羅列以往所有經(jīng)歷的方法只有少數(shù)人會這么做,大部分的人采用的是更直接的方法,即利用直覺。那么,直覺是什么?其實直覺也是你在潛意識狀態(tài)下思考經(jīng)驗后得出的規(guī)律。就像你通過機(jī)器學(xué)習(xí)算法,得到了一個模型,那么你下次只要直接使用就行了。那么這個規(guī)律你是什么時候思考的?可能是在你無意識的情況下,例如睡覺,走路等情況。這種時候,大腦其實也在默默地做一些你察覺不到的工作。

這種直覺與潛意識,我把它與另一種人類思考經(jīng)驗的方式做了區(qū)分。如果一個人勤于思考,例如他會每天做一個小結(jié),譬如“吾日三省吾身”,或者他經(jīng)常與同伴討論最近工作的得失,那么他這種訓(xùn)練模型的方式是直接的,明意識的思考與歸納。這樣的效果很好,記憶性強(qiáng),并且更能得出有效反應(yīng)現(xiàn)實的規(guī)律。但是大部分的人可能很少做這樣的總結(jié),那么他們得出生活中規(guī)律的方法使用的就是潛意識法。

舉一個作者本人關(guān)于潛意識的例子。作者本人以前沒開過車,最近一段時間買了車后,天天開車上班。我每天都走固定的路線。有趣的是,在一開始的幾天,我非常緊張的注意著前方的路況,而現(xiàn)在我已經(jīng)在無意識中就把車開到了目標(biāo)。這個過程中我的眼睛是注視著前方的,我的大腦是沒有思考,但是我手握著的方向盤會自動的調(diào)整方向。也就是說。隨著我開車次數(shù)的增多,我已經(jīng)把我開車的動作交給了潛意識。這是非常有趣的一件事。在這段過程中,我的大腦將前方路況的圖像記錄了下來,同時大腦也記憶了我轉(zhuǎn)動方向盤的動作。經(jīng)過大腦自己的潛意識思考,最后生成的潛意識可以直接根據(jù)前方的圖像調(diào)整我手的動作。假設(shè)我們將前方的錄像交給計算機(jī),然后讓計算機(jī)記錄與圖像對應(yīng)的駕駛員的動作。經(jīng)過一段時間的學(xué)習(xí),計算機(jī)生成的機(jī)器學(xué)習(xí)模型就可以進(jìn)行自動駕駛了。這很神奇,不是么。其實包括Google、特斯拉在內(nèi)的自動駕駛汽車技術(shù)的原理就是這樣。除了自動駕駛汽車以外,潛意識的思想還可以擴(kuò)展到人的交際。譬如說服別人,一個最佳的方法就是給他展示一些信息,然后讓他自己去歸納得出我們想要的結(jié)論。這就好比在闡述一個觀點時,用一個事實,或者一個故事,比大段的道理要好很多。古往今來,但凡優(yōu)秀的說客,無不采用的是這種方法。春秋戰(zhàn)國時期,各國合縱連橫,經(jīng)常有各種說客去跟一國之君交流,直接告訴君主該做什么,無異于自尋死路,但是跟君主講故事,通過這些故事讓君主恍然大悟,就是一種正確的過程。這里面有許多杰出的代表,如墨子,蘇秦等等。基本上所有的交流過程,使用故事說明的效果都要遠(yuǎn)勝于闡述道義之類的效果好很多。為什么用故事的方法比道理或者其他的方法好很多,這是因為在人成長的過程,經(jīng)過自己的思考,已經(jīng)形成了很多規(guī)律與潛意識。如果你告訴的規(guī)律與對方的不相符,很有可能出于保護(hù),他們會本能的拒絕你的新規(guī)律,但是如果你跟他講一個故事,傳遞一些信息,輸送一些數(shù)據(jù)給他,他會思考并自我改變。他的思考過程實際上就是機(jī)器學(xué)習(xí)的過程,他把新的數(shù)據(jù)納入到他的舊有的記憶與數(shù)據(jù)中,經(jīng)過重新訓(xùn)練。如果你給出的數(shù)據(jù)的信息量非常大,大到調(diào)整了他的模型,那么他就會按照你希望的規(guī)律去做事。有的時候,他會本能的拒絕執(zhí)行這個思考過程,但是數(shù)據(jù)一旦輸入,無論他希望與否,他的大腦都會在潛意識狀態(tài)下思考,并且可能改變他的看法。如果計算機(jī)也擁有潛意識(正如本博客的名稱一樣),那么會怎么樣?譬如讓計算機(jī)在工作的過程中,逐漸產(chǎn)生了自身的潛意識,于是甚至可以在你不需要告訴它做什么時它就會完成那件事。這是個非常有意思的設(shè)想,這里留給各位讀者去發(fā)散思考吧。

9.總結(jié)

本文首先介紹了互聯(lián)網(wǎng)界與機(jī)器學(xué)習(xí)大牛結(jié)合的趨勢,以及使用機(jī)器學(xué)習(xí)的相關(guān)應(yīng)用,接著以一個“等人故事”展開對機(jī)器學(xué)習(xí)的介紹。介紹中首先是機(jī)器學(xué)習(xí)的概念與定義,然后是機(jī)器學(xué)習(xí)的相關(guān)學(xué)科,機(jī)器學(xué)習(xí)中包含的各類學(xué)習(xí)算法,接著介紹機(jī)器學(xué)習(xí)與大數(shù)據(jù)的關(guān)系,機(jī)器學(xué)習(xí)的新子類深度學(xué)習(xí),最后探討了一下機(jī)器學(xué)習(xí)與人工智能發(fā)展的聯(lián)系以及機(jī)器學(xué)習(xí)與潛意識的關(guān)聯(lián)。經(jīng)過本文的介紹,相信大家對機(jī)器學(xué)習(xí)技術(shù)有一定的了解,例如機(jī)器學(xué)習(xí)是什么,它的內(nèi)核思想是什么(即統(tǒng)計和歸納),通過了解機(jī)器學(xué)習(xí)與人類思考的近似聯(lián)系可以知曉機(jī)器學(xué)習(xí)為什么具有智慧能力的原因等等。其次,本文漫談了機(jī)器學(xué)習(xí)與外延學(xué)科的關(guān)系,機(jī)器學(xué)習(xí)與大數(shù)據(jù)相互促進(jìn)相得益彰的聯(lián)系,機(jī)器學(xué)習(xí)界最新的深度學(xué)習(xí)的迅猛發(fā)展,以及對于人類基于機(jī)器學(xué)習(xí)開發(fā)智能機(jī)器人的一種展望與思考,最后作者簡單談了一點關(guān)于讓計算機(jī)擁有潛意識的設(shè)想。機(jī)器學(xué)習(xí)是目前業(yè)界最為Amazing與火熱的一項技術(shù),從網(wǎng)上的每一次淘寶的購買東西,到自動駕駛汽車技術(shù),以及網(wǎng)絡(luò)攻擊抵御系統(tǒng)等等,都有機(jī)器學(xué)習(xí)的因子在內(nèi),同時機(jī)器學(xué)習(xí)也是最有可能使人類完成AI dream的一項技術(shù),各種人工智能目前的應(yīng)用,如微軟小冰聊天機(jī)器人,到計算機(jī)視覺技術(shù)的進(jìn)步,都有機(jī)器學(xué)習(xí)努力的成分。作為一名當(dāng)代的計算機(jī)領(lǐng)域的開發(fā)或管理人員,以及身處這個世界,使用者IT技術(shù)帶來便利的人們,最好都應(yīng)該了解一些機(jī)器學(xué)習(xí)的相關(guān)知識與概念,因為這可以幫你更好的理解為你帶來莫大便利技術(shù)的背后原理,以及讓你更好的理解當(dāng)代科技的進(jìn)程。10.后記這篇文檔花了作者兩個月的時間,終于在2014年的最后一天的前一天基本完成。通過這篇文章,作者希望對機(jī)器學(xué)習(xí)在國內(nèi)的普及做一點貢獻(xiàn),同時也是作者本人自己對于所學(xué)機(jī)器學(xué)習(xí)知識的一個融匯貫通,整體歸納的提高過程。作者把這么多的知識經(jīng)過自己的大腦思考,訓(xùn)練出了一個模型,形成了這篇文檔,可以說這也是一種機(jī)器學(xué)習(xí)的過程吧(笑)。

作者所在的行業(yè)會接觸到大量的數(shù)據(jù),因此對于數(shù)據(jù)的處理和分析是平常非常重要的工作,機(jī)器學(xué)習(xí)課程的思想和理念對于作者日常的工作指引作用極大,幾乎導(dǎo)致了作者對于數(shù)據(jù)價值的重新認(rèn)識。想想半年前,作者還對機(jī)器學(xué)習(xí)似懂非懂,如今也可以算是一個機(jī)器學(xué)習(xí)的Expert了(笑)。但作者始終認(rèn)為,機(jī)器學(xué)習(xí)的真正應(yīng)用不是通過概念或者思想的方式,而是通過實踐。只有當(dāng)把機(jī)器學(xué)習(xí)技術(shù)真正應(yīng)用時,才可算是對機(jī)器學(xué)習(xí)的理解進(jìn)入了一個層次。正所謂再“陽春白雪”的技術(shù),也必須落到“下里巴人”的場景下運用。目前有一種風(fēng)氣,國內(nèi)外研究機(jī)器學(xué)習(xí)的某些學(xué)者,有一種高貴的逼格,認(rèn)為自己的研究是普通人無法理解的,但是這樣的理念是根本錯誤的,沒有在真正實際的地方發(fā)揮作用,憑什么證明你的研究有所價值呢?作者認(rèn)為必須將高大上的技術(shù)用在改變普通人的生活上,才能發(fā)揮其根本的價值。一些簡單的場景,恰恰是實踐機(jī)器學(xué)習(xí)技術(shù)的最好地方。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標(biāo)題:從機(jī)器學(xué)習(xí)談起

文章出處:【微信號:C_Expert,微信公眾號:C語言專家集中營】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    機(jī)器學(xué)習(xí)的含義、術(shù)語、以及重要性的解析

    機(jī)器學(xué)習(xí)”在最近雖可能不至于到人盡皆知的程度、卻也是非常火熱的詞匯。機(jī)器學(xué)習(xí)是英文單詞“Machine Learning”(簡稱ML)的直譯,從字面上便
    的頭像 發(fā)表于 01-19 09:12 ?1.4w次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>的含義、術(shù)語、以及<b class='flag-5'>重要性</b>的解析

    如何學(xué)習(xí)機(jī)器學(xué)習(xí)

    【吳恩達(dá)機(jī)器學(xué)習(xí)學(xué)習(xí)筆記13(Normal Equation& 與梯度下降比較)
    發(fā)表于 04-26 11:05

    機(jī)器學(xué)習(xí)的未來

    機(jī)器學(xué)習(xí)的未來在工業(yè)領(lǐng)域采用機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)和大數(shù)據(jù)
    發(fā)表于 01-27 06:02

    機(jī)器人控制技術(shù)哪些重要性

    PID控制的優(yōu)點哪些?機(jī)器人控制技術(shù)哪些重要性
    發(fā)表于 06-18 08:02

    介紹機(jī)器學(xué)習(xí)的基礎(chǔ)內(nèi)容

    文檔文章目錄系列文章目錄前言一、pandas是什么?二、使用步驟1.引入庫2.讀入數(shù)據(jù)總結(jié)前言提示:這里可以添加本文要記錄的大概內(nèi)容:例如:隨著人工智能的不斷發(fā)展,機(jī)器學(xué)習(xí)這門技術(shù)也越來越重要,很多人都開啟了
    發(fā)表于 08-13 07:39

    機(jī)器學(xué)習(xí)的基礎(chǔ)內(nèi)容

    文檔文章目錄系列文章目錄前言一、pandas是什么?二、使用步驟1.引入庫2.讀入數(shù)據(jù)總結(jié)前言提示:這里可以添加本文要記錄的大概內(nèi)容:例如:隨著人工智能的不斷發(fā)展,機(jī)器學(xué)習(xí)這門技術(shù)也越來越重要,很多人都開啟了
    發(fā)表于 02-09 06:47

    機(jī)器學(xué)習(xí)算法中的FSS算法詳細(xì)資料合集免費下載

    本文檔的主要內(nèi)容詳細(xì)介紹的是機(jī)器學(xué)習(xí)算法中的FSS算法詳細(xì)資料合集免費下載。
    發(fā)表于 11-22 17:07 ?9次下載

    機(jī)器學(xué)習(xí)matlab源代碼的詳細(xì)資料免費下載

    本文檔的主要內(nèi)容詳細(xì)介紹的是機(jī)器學(xué)習(xí)matlab源代碼的詳細(xì)資料免費下載。
    發(fā)表于 11-23 16:49 ?31次下載

    機(jī)器學(xué)習(xí)教程之機(jī)器學(xué)習(xí)10大經(jīng)典算法的詳細(xì)資料講解

    本文檔的主要內(nèi)容詳細(xì)介紹的是機(jī)器學(xué)習(xí)教程之機(jī)器學(xué)習(xí)10大經(jīng)典算法的詳細(xì)資料講解主要內(nèi)容包括了:1
    發(fā)表于 12-14 15:03 ?25次下載

    學(xué)習(xí)機(jī)器人對教育什么樣的作用

    學(xué)習(xí)機(jī)器人并非僅僅是學(xué)習(xí)機(jī)器人知識,而是學(xué)習(xí)通向未來的方法。中國孩子缺少的不是知識,而是觀點。提出問題在很多時候比解決問題更重要,解決問題靠知識和經(jīng)驗,提出問題是科學(xué)乃至人類進(jìn)步的起點
    的頭像 發(fā)表于 06-01 10:48 ?6387次閱讀

    機(jī)器學(xué)習(xí)教程之線性模型的詳細(xì)資料說明

    本文檔的主要內(nèi)容詳細(xì)介紹的是機(jī)器學(xué)習(xí)教程之線性模型的詳細(xì)資料說明
    發(fā)表于 03-24 08:00 ?0次下載
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>教程之線性模型的<b class='flag-5'>詳細(xì)資料</b><b class='flag-5'>說明</b>

    機(jī)器學(xué)習(xí)的模型評估與選擇詳細(xì)資料說明

    本文檔的主要內(nèi)容詳細(xì)介紹的是機(jī)器學(xué)習(xí)的模型評估與選擇詳細(xì)資料說明
    發(fā)表于 03-24 08:00 ?0次下載
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>的模型評估與選擇<b class='flag-5'>詳細(xì)資料</b><b class='flag-5'>說明</b>

    學(xué)習(xí)機(jī)器學(xué)習(xí)的方法及如何運用Python

    ,如今在實體和在線的學(xué)習(xí)機(jī)器學(xué)習(xí)的資源很多,本文整理了一些好用學(xué)習(xí)資源希望幫助初學(xué)者能更容易使用 Python 入門機(jī)器
    發(fā)表于 08-07 16:02 ?943次閱讀

    Rpibot學(xué)習(xí)機(jī)器人開源分享

    電子發(fā)燒友網(wǎng)站提供《Rpibot學(xué)習(xí)機(jī)器人開源分享.zip》資料免費下載
    發(fā)表于 11-21 11:17 ?1次下載
    Rpibot<b class='flag-5'>學(xué)習(xí)機(jī)器</b>人開源分享

    什么是機(jī)器學(xué)習(xí)?它的重要性體現(xiàn)在哪

    任務(wù)的解決方法。機(jī)器學(xué)習(xí)重要性體現(xiàn)在幾個方面數(shù)據(jù)處理能力:在當(dāng)今數(shù)字化時代,我們產(chǎn)生了大量的數(shù)據(jù)。機(jī)器學(xué)習(xí)能夠處理和分析這些龐大的數(shù)據(jù)集,
    的頭像 發(fā)表于 01-05 08:27 ?1717次閱讀
    什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>?它的<b class='flag-5'>重要性</b>體現(xiàn)在哪
    神州百家乐官网的玩法技巧和规则 | 百家乐第三张规则| 新澳博娱乐| 缅甸百家乐官网龙虎斗| 博坊百家乐游戏| 大发888游戏代充值100| 九江市| 风水97年农历6月24八字| 新濠百家乐的玩法技巧和规则| 皇冠国际现金网| 三星百家乐官网的玩法技巧和规则 | 新葡京官网| 狮威百家乐官网娱乐| 网上百家乐的玩法技巧和规则| 真钱赌博网站| 葡京百家乐官网的玩法技巧和规则 | 阳宅24方位判断方法| 大发888博彩论坛贴吧| 高手百家乐官网赢钱法| 百家乐澳门百家乐| 破解百家乐打路单| 比分直播| 百家乐官网定位胆技巧| 百家乐官网牌壳| 大发888游戏平台| 百家乐官网赌场导航| 木棉百家乐的玩法技巧和规则| 北宁市| 代理百家乐免费试玩| 龙胜| 百家乐技巧论坛| 澳门赌场女| 澳门百家乐小游戏| 犍为县| 百家乐游戏怎么刷钱| 九龙城区| 百家乐是否有规律| 屯昌县| 百家乐赌场代理| 哪个百家乐官网网站最大| 百家乐画面|