工業(yè)大數(shù)據(jù)具有一般大數(shù)據(jù)的特征(海量性、多樣性等),此基礎上具有 價值性 、 實時性 、 準確性 、 閉環(huán)性 四個典型的特征。
工業(yè)大數(shù)據(jù)與互聯(lián)網大數(shù)據(jù)最大的區(qū)別在于工業(yè)大數(shù)據(jù)有非常強的目的性,而互聯(lián)網大數(shù)據(jù)更多的是一種關聯(lián)的挖掘,是更加發(fā)散的一種分析。除此之外,兩者在數(shù)據(jù)的特征和面臨的問題方面也有不同。有別于互聯(lián)網大數(shù)據(jù),工業(yè)大數(shù)據(jù)的分析技術核心要解決 “3B” 問題:
1、Below Surface —— 隱匿性,即需要洞悉背后的意義
工業(yè)環(huán)境中的大數(shù)據(jù)與互聯(lián)網大數(shù)據(jù)相比,最重要的不同在于對數(shù)據(jù)特征的提取上面,工業(yè)大數(shù)據(jù)注重特征背后的物理意義以及特征之間關聯(lián)性的機理邏輯,而互聯(lián)網大數(shù)據(jù)則傾向于僅僅依賴統(tǒng)計學工具挖掘屬性之間的相關性。
2、Broken —— 碎片化,即需要避免斷續(xù)、注重時效性
相對于互聯(lián)網大數(shù)據(jù)的量,工業(yè)大數(shù)據(jù)更注重數(shù)據(jù)的全,即面向應用要求具有盡可能全面的使用樣本,以覆蓋工業(yè)過程中的各類變化條件、保障從數(shù)據(jù)中能夠提取以反映對象真實狀態(tài)的信息全面性。因此,工業(yè)大數(shù)據(jù)一方面需要在后端的分析方法上克服數(shù)據(jù)碎片化帶來的困難,利用特征提取等手段將這些數(shù)據(jù)轉化為有用的信息,另一方面,更是需要從數(shù)據(jù)獲取的前端設計中以價值需求為導向制定數(shù)據(jù)標準,進而在數(shù)據(jù)與信息流通的平臺中構建統(tǒng)一的數(shù)據(jù)環(huán)境。
3、Bad Quality —— 低質性,即需要提高數(shù)據(jù)質量、滿足低容錯性
數(shù)據(jù)碎片化缺陷來源的另一方面也顯示出對于數(shù)據(jù)質量的擔憂。即數(shù)據(jù)的數(shù)量并無法保障數(shù)據(jù)的質量,這就可能導致數(shù)據(jù)的低可用率,因為低質量的數(shù)據(jù)可能直接影響到分析過程而導致結果無法利用。
但互聯(lián)網大數(shù)據(jù)則不同,其可以只針對數(shù)據(jù)本身做挖掘、關聯(lián)而不考慮數(shù)據(jù)本身的意義,即挖掘到什么結果就是什么結果。最典型的就是經過超市購物習慣的數(shù)據(jù)挖掘后啤酒貨架就可以擺放在尿不濕貨架的對面,而不用考慮他們之間有什么機理性的邏輯關系 ;換句話說,相比于互聯(lián)網大數(shù)據(jù)通常并不要求有多么精準的結果推送,工業(yè)大數(shù)據(jù)對預測和分析結果的容錯率遠遠比互聯(lián)網大數(shù)據(jù)低的多。
互聯(lián)網大數(shù)據(jù)在進行預測和決策時,僅僅考慮的是兩個屬性之間的關聯(lián)是否具有統(tǒng)計顯著性,其中的噪聲和個體之間的差異在樣本量足夠大時都可以被忽略,這樣給出的預測結果的準確性就會大打折扣。
比如當我覺得有 70% 的顯著性應該給某個用戶推薦 A 類電影,即使用戶并非真正喜歡這類電影也不會造成太嚴重的后果。但是在工業(yè)環(huán)境中,如果僅僅通過統(tǒng)計的顯著性給出分析結果,哪怕僅僅一次的失誤都可能造成嚴重的后果。
-
工業(yè)大數(shù)據(jù)
關注
0文章
72瀏覽量
7879 -
互聯(lián)網大數(shù)據(jù)
關注
0文章
7瀏覽量
1428
發(fā)布評論請先 登錄
相關推薦
評論