【導(dǎo)讀】本文介紹了包括圖像分類、交易預(yù)測(cè)、情感分類、推薦系統(tǒng)、股票預(yù)測(cè)等在內(nèi)的若干個(gè)機(jī)器學(xué)習(xí)應(yīng)用及數(shù)據(jù)集。
1.鳶尾花分類
Iris Flowers數(shù)據(jù)集被視為ML的“Hello World”,因?yàn)樗欠诸惖牡湫屠印_@個(gè)數(shù)據(jù)集的好處是它只有四個(gè)屬性:花瓣長度,花瓣寬度,萼片長度和萼片寬度,可加載到內(nèi)存中。
該項(xiàng)目涉及使用四種已知特的不同種類的鳶尾花。
分類類型?這里使用多類分類。這意味著我們應(yīng)該能夠準(zhǔn)確地預(yù)測(cè)數(shù)據(jù)點(diǎn)屬于哪個(gè)類。
目標(biāo):根據(jù)花的特性對(duì)三種花進(jìn)行分類:花瓣和萼片的尺寸。
2. 交易預(yù)測(cè)
GNY的小組發(fā)布了一個(gè)演示程序,展示了該平臺(tái)如何通過其強(qiáng)大的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)零售交易組,并且該平臺(tái)的完全可下載和可定制版本將在今年夏天推出。GNY將有一個(gè)可選擇的機(jī)器學(xué)習(xí)代碼集庫,可以根據(jù)每個(gè)人的要求進(jìn)行選擇,并可以應(yīng)用于他們的側(cè)鏈(因?yàn)镚NY將使用Lisk的側(cè)鏈技術(shù))。
為什么這個(gè)這么重要?幾乎所有企業(yè)都在尋找一種經(jīng)濟(jì)實(shí)惠的方式來挖掘其數(shù)據(jù)中的隱藏價(jià)值,但是如果它將它們暴露給安全風(fēng)險(xiǎn)則不會(huì)。區(qū)塊鏈的固有結(jié)構(gòu)有助于控制數(shù)據(jù)一致性,并保持對(duì)數(shù)據(jù)的控制
性能提高,因?yàn)樵谇耙粋€(gè)塊仍處于活動(dòng)狀態(tài)時(shí),已經(jīng)可以為后續(xù)塊啟動(dòng)驗(yàn)證。驗(yàn)證包括檢查用戶是否有足夠的余額。只有錯(cuò)誤預(yù)測(cè)的交易,才需要重做這項(xiàng)工作。
這個(gè)演示是一個(gè)有趣的入門項(xiàng)目,適合想要預(yù)測(cè)簡單數(shù)字的人,今年夏天推出的完整平臺(tái)應(yīng)該為開發(fā)人員提供更多功能和定制。可以在MLWave找到一個(gè)好的數(shù)據(jù)集,用于使用購買歷史來預(yù)測(cè)重復(fù)購買者。
目標(biāo):根據(jù)支出歷史預(yù)測(cè)未來交易。
3. Twitter的情感分析
機(jī)器學(xué)習(xí)的一個(gè)有趣應(yīng)用是情感分析。隨著加密貨幣的興起,情緒分析取得了重大突破。許多人試圖建立包含情緒分析的交易機(jī)器人,以做出更好的交易決策。
還有許多其他平臺(tái)可用于情緒分析,如Reddit,F(xiàn)acebook或LinkedIn,因?yàn)樗鼈兌继峁┮子谑褂玫腁PI來檢索數(shù)據(jù)。但是,由于Twitter平臺(tái)上數(shù)據(jù)的格式一致,這是機(jī)器學(xué)習(xí)的首選數(shù)據(jù)。由于推文主要由文本,URL和主題標(biāo)簽組成,因此預(yù)處理也更容易。
Twitter API知道許多可用于集成到項(xiàng)目中的API庫。可以使用!pip install python-twitter通過pip安裝Python的包裝器。
分析幾個(gè)有趣的例子:
圍繞新發(fā)布的電影的評(píng)論,并將其與IMDB和其他評(píng)級(jí)網(wǎng)站上的評(píng)論進(jìn)行比較。
圍繞特定選舉或任何其他趨勢(shì)政治話題的情緒。
根據(jù)推文的情緒預(yù)測(cè)前50種加密貨幣價(jià)格的未來方向。
目標(biāo):情緒分析器學(xué)習(xí)一段內(nèi)容背后的各種情緒。此任務(wù)可幫助您考慮設(shè)計(jì)各種模型以將推文標(biāo)記為正面或負(fù)面。在后期階段,我們可以用更加細(xì)致的方式標(biāo)記推文,如“中性”,“憤怒”,“樂觀”,......
4.使用Movielens的推薦系統(tǒng)
推薦系統(tǒng)是機(jī)器學(xué)習(xí)技術(shù)在商業(yè)中最成功和最廣泛的應(yīng)用之一。您可以在日常生活中隨處找到推薦系統(tǒng)。例如,在觀看Youtube視頻時(shí),Youtube算法會(huì)根據(jù)您的觀看習(xí)慣向您推薦視頻,同時(shí)也會(huì)根據(jù)觀察運(yùn)行ML算法的模式對(duì)全世界人們的觀看行為提出關(guān)鍵見解。
我們可以為推薦系統(tǒng)找到兩種算法:
基于內(nèi)容:它尋找內(nèi)容的相其與其他人進(jìn)行比較以找到類似的行為/喜好。下圖說明了這一點(diǎn)。
目前,Movielens提供了最受歡迎的電影評(píng)級(jí)數(shù)據(jù)集之一,這是初學(xué)者試驗(yàn)的理想數(shù)據(jù)集。
目標(biāo):根據(jù)評(píng)分,預(yù)測(cè)用戶喜歡哪些電影。
5. Quandl股票價(jià)格預(yù)測(cè)
股票價(jià)格預(yù)測(cè)器是一個(gè)了解公司業(yè)績并預(yù)測(cè)未來股票價(jià)格的系統(tǒng)。股票價(jià)格預(yù)測(cè)的問題是可以使用許多類型和數(shù)據(jù)來源:
波動(dòng)率指數(shù)
歷史價(jià)格
全球宏觀經(jīng)濟(jì)指標(biāo)
基本面分析
使用指標(biāo)的技術(shù)分析
分析股票市場的好處是它具有更短的反饋周期,這使得更容易驗(yàn)證您的預(yù)測(cè)。如果您不了解市場周期,我建議您閱讀有關(guān)此主題的內(nèi)容,以了解典型周期的情況。
為了簡單起見,您可以選擇一個(gè)簡單的機(jī)器學(xué)習(xí)示例,如根據(jù)組織的季度報(bào)告預(yù)測(cè)6個(gè)月的價(jià)格變動(dòng)。
目標(biāo):使用基本和技術(shù)指標(biāo)預(yù)測(cè)未來價(jià)格。
-
圖像分類
+關(guān)注
關(guān)注
0文章
93瀏覽量
11956 -
股票預(yù)測(cè)
+關(guān)注
關(guān)注
0文章
2瀏覽量
6812 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8438瀏覽量
133084 -
推薦系統(tǒng)
+關(guān)注
關(guān)注
1文章
43瀏覽量
10092
原文標(biāo)題:機(jī)器學(xué)習(xí)如何入門?這五大機(jī)器學(xué)習(xí)項(xiàng)目帶你飛
文章出處:【微信號(hào):CAAI-1981,微信公眾號(hào):中國人工智能學(xué)會(huì)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論