那曲檬骨新材料有限公司

您好,歡迎來電子發燒友網! ,新用戶?[免費注冊]

您的位置:電子發燒友網>源碼下載>數值算法/人工智能>

Spring框架在數據處理方面的進步

大小:0.6 MB 人氣: 2017-10-12 需要積分:1
 導言:本文講述了Spring數據框架在數據處理以及微服務方面的進化史。
  定量分析能否成功,在很大程度上要依賴于其收集、存儲與處理數據的能力。如果企業決策者能獲得及時、可靠的見解分析,那么大數據項目的成功幾率就會有所提高。
  如今,想要為數據處理搭建合適的架構,需要付出頗為可觀的努力。數據處理的類型主要集中在三個方面:
  批處理:多用于處理大量具有可擴展性與分布性的靜態數據。 實時處理:主要用于處理流式數據(連續不斷的無限數據流),這類數據具有分布性與高速率特質。 混合計算模式:這種模式是批處理與實時處理的結合,可處理大容量的高速率數據。
  大數據工程很花時間,同時要求工程師具備數據采集與數據處理的相關技巧,在大多解決方案中,時間與技能這兩點都必不可少。Pivotal公司發布的Spring XD和Spring Cloud Dataflow這兩款產品,都是用于減少大數據工程中開銷的。本文會對Spring XD做以簡單的介紹,并對其最新版,也就是Spring Cloud Data Flow進行更為詳盡的介紹。
  Spring XD
  第一輪創新的結果造就了Spring XD(eXtreme Data,極限數據),這項技術為解決大數據處理的相關任務提供了易于使用的解決方案。Spring XD建立在成熟的Spring技術之上,為數據獲取、遷移、處理、深度分析、流處理以及批處理任務提供支持。
  Spring XD提供的框架可用于實時處理及批處理任務,該框架具有復雜性、穩定性及可擴展性。有了Spring XD,無論是收集數據,還是將數據從不同的數據源遷移到目標上,都變得更為簡單。
  Spring XD架構已廣泛用于傳統的企業ETL中、實時分析中與數據科學項目的工作臺的創建中。
  基于Spring XD的架構:
  這種架構在下圖中有所表現,在下列模塊協助下,我們能夠創建、運行、部署、撤銷數據流通道(data pipeline),在框架中執行任意類型的數據處理任務。
  Spring框架在數據處理方面的進步
  SpringXD的主要組件是Admin和Container。
  Admin UI向服務器發送需要處理的請求,而服務器通過執行任務的相關模塊來處理請求。在這里,一個模塊就是創建Spring應用前后關系(application context)的一個組件。
  所有模塊都需要XD容器才能運行和執行任務。
  下面是Spring XD架構的關鍵模塊。
  Source:數據流的創建總是始于source模塊。Source可以使用輪詢機制或事件驅動機制,并且只會輸出一個結果。 Processor:接受信息輸入,并對輸入的信息執行某種類型的處理,然后再輸出信息。 Sink:顧名思義這個模塊是負責終止數據流的,然后將輸出結果發送到HDFS之類的外部資源中。 Job:這個模塊負責執行批處理任務。
  Spring Cloud Data Flow的需求
  在Spring XD中,本質上不斷變更的應用與需求之間還存在著缺口,需要我們在新一輪創新中解決。下面是推動新框架需求最為關鍵的要求:
  在云技術的推動下,平臺級別的操作與非功能需求都能很容易的實現。至于應用級別的非功能需求,仍是很有挑戰性的。
  我們對系統分階段交付、執行動態資源分配、具有擴展能力以及在分布式環境中追蹤的能力,都有著越來越大的需求。
  如今,人們對于平臺的需求從功能性轉向選擇云供應商。基于微服務的云架構更適合這一目標,但Spring XD并不能直接支持微服務架構。
  Spring XD支持大數據場景,但仍有很大一部分項目無需Hadoop提供數據存儲與處理服務。
  Spring Cloud Data Flow
  在第二輪的創新中,Pivotal公司推出了Spring Cloud Data Flow,作為Spring XD的替代產品。Spring Cloud Data Flow繼承了Spring XD的優點,并提供了更有擴展性的解決方案——利用云技術的原生方式。Spring Cloud Data Flow是一個混合計算模型,結合了流數據與批量數據的處理方式。開發者可以通過Spring Cloud Data Flow,在諸如數據獲取、實時分析、批處理等常見用例中執行數據流的創建與編排。Spring Cloud Data Flow的目標就是為了方便數據工程師,讓他們能專注于分析工作和具體的問題。Spring Cloud Data Flow僅提供了管理服務的模型。
  Spring Cloud Data Flow的架構
  Spring Cloud Data Flow是Spring XD的修訂版,在功能的構成方式上,還有如何協助原生云架構擴展應用方面,都做出了根本性的改變。
  Spring Cloud Data Flow不再使用傳統基于組件的架構了,而是采用了信息驅動的微服務架構,這種架構更適合原生云應用平臺的原生應用。Spring XD的模塊現在被部署到云上的微服務取代。
  主要變化出現在下面這些領域中:
  Spring Cloud Data Flow利用原生云平臺引進了新的服務提供商接口(SPI),取代Spring XD原有的運行層。
  雖然類似Admin REST API、shell層和UI層之類的用戶接口與集成元素都與Spring XD中的一致,但底層架構發生了變化。
  服務提供商接口或者SPI取代了基于Zookeeper的運行方式。現在,SPI能夠協同Pivotal的Cloud Foundry或者Yarn之類監控/發布微服務應用的系統一同運作。

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發表評論

      用戶評論
      評價:好評中評差評

      發表評論,獲取積分! 請遵守相關規定!

      ?
      24山坐向| 利来百家乐官网的玩法技巧和规则| 赌博百家乐赢不了| 上海二八杠分析仪| 迪威百家乐官网现场| 帝王百家乐官网的玩法技巧和规则 | 百家乐官网长t恤| 威尼斯人娱乐城真钱百家乐| 网上百家乐官网哪里好| 百家乐3珠路法| 十六浦娱乐城| 赌百家乐官网心里技巧| 百家乐事电影| 百家乐平台| 伟博百家乐现金网| 合乐娱乐| 百佬汇百家乐官网的玩法技巧和规则| 金都百家乐的玩法技巧和规则 | 网上赌百家乐官网的玩法技巧和规则| 澳门百家乐搏牌规则| 黄大仙区| 百家乐游戏玩法技巧| 福海县| 玩百家乐五湖四海娱乐城| 立博国际| 属龙属虎合伙做生意吗| 双色球大赢家| 单张百家乐论坛| 真龙娱乐城| 太阳城百家乐客户端| 进贤县| 百家乐投注庄闲法| a8娱乐城官方网站| 新葡京百家乐官网的玩法技巧和规则 | 大发888官网df888esbgfwz| 百家乐官网新送彩金| 星空棋牌大厅下载| 百家乐百家乐群| 香港六合彩特码资料| 百家乐有多少网址| 百家乐官网赌博出千|