數據流最初是通信領域使用的概念,代表傳輸中所使用的信息的數字編碼信號序列。然而,我們所提到的數據流概念與此不同。這個概念最初在1998年由Henzinger在文獻87中提出,他將數據流定義為“只能以事先規定好的順序被讀取一次的數據的一個序列”。
數據流應用的產生的發展是以下兩個因素的結果:
細節數據:
已經能夠持續自動產生大量的細節數據。這類數據最早出現于傳統的銀行和股票交易領域,后來則也出現在地質測量、氣象、天文觀測等方面。尤其是互聯網(網絡流量監控,點擊流)和無線通信網(通話記錄)的出現,產生了大量的數據流類型的數據。我們注意到這類數據大都與地理信息有一定關聯,這主要是因為地理信息的維度較大,容易產生這類大量的細節數據。
復雜分析:
需要以近實時的方式對更新流進行復雜分析。對以上領域的數據進行復雜分析(如趨勢分析,預測)以前往往是(在數據倉庫中)脫機進行的,然而一些新的應用(尤其是在網絡安全和國家安全領域)對時間都非常敏感,如檢測互聯網上的極端事件、欺詐、入侵、異常,復雜人群監控,趨勢監控,探查性分析,和諧度分析等,都需要進行聯機的分析。
在此之后,學術界基本認可了這個定義,有的文章也在此基礎上對定義稍微進行了修改。例如,S. Guha等認為,數據流是“只能被讀取一次或少數幾次的點的有序序列”,這里放寬了前述定義中的“一遍”限制。
-
數據流
+關注
關注
0文章
121瀏覽量
14437
發布評論請先 登錄
相關推薦
評論