對(duì)云計(jì)算的定義
云計(jì)算其實(shí)跟PC機(jī)有一樣的概念,有CPU、硬盤、操作系統(tǒng)、應(yīng)用軟件。云計(jì)算的計(jì)算節(jié)點(diǎn)(虛擬機(jī))就是PC中的CPU,數(shù)據(jù)緩存服務(wù)就是PC的內(nèi)存,存儲(chǔ)節(jié)點(diǎn)就是PC的硬盤,提供數(shù)據(jù)服務(wù),讓數(shù)據(jù)不丟、高可用,PC中的控制器就是云計(jì)算的控制系統(tǒng)。
PC機(jī)的硬件上面要有操作系統(tǒng)。操作系統(tǒng)很大一塊是給開發(fā)人員提供系統(tǒng)的API接口,提供系統(tǒng)監(jiān)控以看運(yùn)行情況,并且還要有系統(tǒng)管理——如用戶賬號(hào)的權(quán)限管理、備份恢復(fù)等等。操作系統(tǒng)上面要有應(yīng)用軟件,這樣才能服務(wù)于最終用戶,應(yīng)用軟件就是真正落地的業(yè)務(wù),這樣才會(huì)有用戶;有了用戶,整個(gè)體系就運(yùn)轉(zhuǎn)起來了。
這就是工程師說的stack,也就是我們聽到的IaaS、PaaS、SaaS三個(gè)層。
IaaS層就像PC機(jī)的基礎(chǔ)硬件加驅(qū)動(dòng)程序,PaaS層就像PC機(jī)上的操作系統(tǒng)——把基礎(chǔ)硬件抽象、包起來并屏蔽硬件和硬件驅(qū)動(dòng)細(xì)節(jié)、調(diào)度基礎(chǔ)硬件,而SaaS層就是PC機(jī)里的應(yīng)用軟件。
另外,我們還得給開發(fā)人員提供各種開發(fā)框架、類庫和開發(fā)環(huán)境,這就是為什么AWS還做通知、消息、工作流,這是用于粘合操作系統(tǒng)和業(yè)務(wù)層的,比如可以讓你方便地做水平擴(kuò)展和分布式。
云計(jì)算自然也會(huì)像PC機(jī)一樣,三個(gè)層上都會(huì)有用于控制和管理的系統(tǒng)。這就是為什么云計(jì)算會(huì)做成這個(gè)樣子,其實(shí)計(jì)算機(jī)的發(fā)展就在這個(gè)圈子里繞。
其實(shí),最終用戶基本并不關(guān)心你CPU用的啥,存儲(chǔ)用的是啥,你用什么框架開發(fā),他們關(guān)心更多的是可以解決什么問題,有什么樣的用戶體驗(yàn)。像以前Windows用戶體驗(yàn)之所以比Linux好,就是因?yàn)閼?yīng)用層用的舒服;而Linux對(duì)開發(fā)者的用戶體驗(yàn)比Windows好,就是因?yàn)槠溟_放和可以讓開發(fā)人員更靈活、更自由。
我們可以看到SaaS層上有的像SalesForce、Dropbox、Evernote、Netflix這樣的給最終用戶的服務(wù),他們更傾向于最終用戶和業(yè)務(wù)。
說到底,云計(jì)算的IaaS、PaaS、SaaS最后那個(gè)S都是Service。就是說,無論你云計(jì)算長成什么樣,都得要向用戶提供“服務(wù)”而不僅僅是軟硬件和各種資源。
云計(jì)算的技術(shù)難點(diǎn)
到今天,云計(jì)算的工業(yè)實(shí)現(xiàn)已經(jīng)不太難了。現(xiàn)在有開源軟件KVM和Xen,這兩個(gè)東西基本把虛擬化搞定;而OpenStack則把管理、控制系統(tǒng)搞定,也很成熟。
PaaS也有相應(yīng)的開源,比如OpenShift,而Java里也有N多的中間件框架和技術(shù)。另外分布式文件系統(tǒng)GFS/TFS,分布式計(jì)算系統(tǒng)Hadoop/Hbase等等,分布式的東西都不神秘了。技術(shù)的實(shí)現(xiàn)在以前可能是問題,現(xiàn)在不是了。
對(duì)于云計(jì)算工程方面,現(xiàn)在最難的是運(yùn)維。管100臺(tái)、1萬臺(tái)還是100萬臺(tái)機(jī)器,那是完全不同的。機(jī)器少你可以用人管理,機(jī)器多是不可能靠人的。運(yùn)維系統(tǒng)不屬于功能性的東西,用戶看不見,所以這是被大家嚴(yán)重低估的東西。只要你做大了,就必然要在運(yùn)維系統(tǒng)上做文章。數(shù)據(jù)中心/云計(jì)算拼的就是運(yùn)維能力。
為什么我說運(yùn)維比較復(fù)雜,原因有這么幾個(gè)。
一方面,云計(jì)算要用廉價(jià)設(shè)備取代那些昂貴的解決方案。所謂互聯(lián)網(wǎng)的文化就是屌絲文化,屌絲就是便宜,互聯(lián)網(wǎng)就是要用便宜的東西搭建出高質(zhì)量的東西,硬件和資源一定不會(huì)走高端路線——比如EMC、IBM小型機(jī)、SGI超級(jí)計(jì)算機(jī)等等,你如果用它去搭建云計(jì)算,成本太貴。
用廉價(jià)的解決方案代替昂貴的解決方案是整個(gè)計(jì)算機(jī)發(fā)展史中到今天唯一不變的事情。所以如果你要讓夏利車跑出奔馳車的感覺,你需要自己動(dòng)手做很多事,搭建一個(gè)智能的系統(tǒng)。用廉價(jià)的東西做出高質(zhì)量的東西,運(yùn)維好廉價(jià)的設(shè)備其實(shí)是云計(jì)算工程里最大的挑戰(zhàn)。
另一方面,因?yàn)槟銠C(jī)器多了,然后你用的又不是昂貴的硬件,所以故障就變成了常態(tài),硬盤、主板、網(wǎng)絡(luò)天天壞。所以,沒什么好想的,運(yùn)維就必須要跟上。云計(jì)算的目標(biāo)是在故障成為常態(tài)的情況下保證高可用——也就是我們所說的,你服務(wù)的可用性是3個(gè)9、4個(gè)9還是5個(gè)9。
最后,這一大堆機(jī)器和設(shè)備都放在一起,你的安全就是一個(gè)挑戰(zhàn),一方面是Security,另一方面是Safety,保證數(shù)十臺(tái)數(shù)百臺(tái)的設(shè)備的安全還好說,但是對(duì)于數(shù)萬數(shù)十萬臺(tái)的設(shè)計(jì),就沒有那么簡單了。
所以,面對(duì)這樣的難題,人是無法搞得定的,你只能依靠技術(shù)來管理和運(yùn)維整個(gè)平臺(tái)。比如必須有監(jiān)控系統(tǒng)。這跟操作系統(tǒng)一樣,對(duì)資源的管理,對(duì)網(wǎng)絡(luò)流量、CPU利用率、進(jìn)程、內(nèi)存等等的狀態(tài)肯定要全部收集的。收集整個(gè)集群各種節(jié)點(diǎn)的狀態(tài),是必然每個(gè)云計(jì)算都有的,都是大同小異的。
然后,你還要找到可用性更好的節(jié)點(diǎn),這需要有一些故障自檢的功能。比如阿里云就遇到過磁盤用到一定時(shí)候就會(huì)莫名其妙的不穩(wěn)定,有些磁盤的I/O會(huì)變慢。變慢的原因有可是硬盤不行了,于是硬盤控制器可能因?yàn)镃RC校驗(yàn)出錯(cuò)需要要多讀幾次,這就好比TCP的包傳過來,數(shù)據(jù)出錯(cuò)了,需要重新傳。在這種硬盤處理半死不活的狀態(tài)時(shí),你肯定是需要一個(gè)自動(dòng)檢測(cè)或自動(dòng)發(fā)現(xiàn)的程序去監(jiān)控這種事情,當(dāng)這個(gè)磁盤可能不行了,標(biāo)記成壞磁盤,別用它,到別的磁盤上讀復(fù)本去。我們要有故障自動(dòng)檢測(cè)、預(yù)測(cè)的措施,才能驅(qū)動(dòng)故障,而不是被動(dòng)響應(yīng)故障,用戶體驗(yàn)才會(huì)好。換句話說,我們需要自動(dòng)化的、主動(dòng)的運(yùn)維。
為了數(shù)據(jù)的高可用性,你只能使用數(shù)據(jù)冗余,寫多份到不同的節(jié)點(diǎn)——工業(yè)界標(biāo)準(zhǔn)寫三份是安全。然而,你做了冗余,又有數(shù)據(jù)一致性問題。為了解決冗余帶來的一致性問題,才有了paxos的投票玩法,大家投票這個(gè)能不能改,于是你就需要一個(gè)強(qiáng)大的控制系統(tǒng)來控制這些東西。
另外,公有云人來人往,里面的資源和服務(wù)今天用明天不用,有分配有釋放,有凍結(jié),你還要搞一個(gè)資源管理系統(tǒng)來管理這些資源的生命狀態(tài)。還有權(quán)限管理,就像AWS的IAM一樣,如果沒有像AWS的IAM權(quán)限管理系統(tǒng),AWS可能會(huì)不會(huì)像今天這樣有很多大的公司來用。企業(yè)級(jí)的云平臺(tái),你需要有企業(yè)級(jí)的運(yùn)維和管理能力。
云計(jì)算的門檻
為啥云計(jì)算有這么多開源的東西,卻不是人人都能做?我覺得有以下原因:
一方面,這就跟蓋樓一樣。蓋樓的技術(shù)沒什么難的(當(dāng)然,蓋高樓是很難的),但是你沒地你怎么蓋?我覺得云計(jì)算也一樣,帶寬的價(jià)格貴得就像土地的價(jià)格。
其實(shí)云計(jì)算跟房地產(chǎn)一樣,要占地、占機(jī)房、占帶寬。如果能把中國所有的機(jī)房、機(jī)柜、帶寬資源都買了,你就不用做云計(jì)算了,賣土地就夠了——因?yàn)檫@些是有限的。
最簡單的例子,IP地址是有限的。你有帶寬、有機(jī)房,但是如果你沒有IP,這就不好玩了。尤其是你要提供CDN服務(wù),這個(gè)就更明顯,因?yàn)橛卸嗌傥锢砉?jié)點(diǎn)直接決定你的CDN服務(wù)質(zhì)量。
另一方面,正如前面所說的,運(yùn)維是件很難的事,運(yùn)維這個(gè)事并不是一般人能搞的事。沒有足夠的場(chǎng)景、經(jīng)驗(yàn)和時(shí)間,這種能力很難出現(xiàn)。
從用戶的角度來說呢,云計(jì)算是一種服務(wù),你需要對(duì)用戶企業(yè)內(nèi)的解決方案要有很好的了解,這樣才能提高很好的服務(wù)。能提供“好服務(wù)”的通常都是把自己真正當(dāng)成用戶公司。
這跟做汽車一樣,底層做引擎、輪子、油箱、控制系統(tǒng),給你弄一堆零件,上層可以拼裝。PaaS相當(dāng)于給你一個(gè)很快可以打造成的汽車的工作臺(tái)。而SaaS就是成品——兩廂、三廂、卡車、轎車,最終用戶要的是這個(gè)。
后面什么Xen、存儲(chǔ)、分布式,跟我一毛錢關(guān)系沒有,我就要知道汽車是安全的,性能好的,省油的,不會(huì)拋錨、耐用的,千萬別速度快了或者坡度大了或是別的怎么樣就失靈了。
賣汽車也是賣服務(wù)。造出汽車來,并不代表你搞定這個(gè)事了。如果沒有公路、沒有加油站、沒有4s店、沒有交通管理、規(guī)則等等,你要么用不了,要么就是亂七八糟。不能只讓用戶在那看著你的汽車好牛啊,但是用戶不知道怎么用。所以說,云計(jì)算最終旁邊必須要有一套服務(wù)設(shè)施,而這套服務(wù)設(shè)施也是今天被人低估的。
云計(jì)算有兩個(gè)東西我覺得是被人低估的,一個(gè)是運(yùn)維,一個(gè)是那堆服務(wù)。做服務(wù)的需要有生態(tài)環(huán)境,有人幫你做。所以做云計(jì)算要落地并不簡單。
這跟IBM一樣。IBM有段時(shí)間也是快不行了,他們的CEO寫了一本《誰說大象不能跳舞》,講IBM的轉(zhuǎn)型,從賣硬件的轉(zhuǎn)成賣服務(wù)、解決方案,有流程、咨詢,順便賣硬件,帶著一堆系統(tǒng)集成商一起玩。
我給你解決方案,誰來實(shí)現(xiàn)呢,就是集成商幫你,然后順便把硬件賣給你。一樣。未來是什么樣,歷史上已經(jīng)有了。你看,要干那么多事,而且還不是用人堆就可以堆出來的。這就是云計(jì)算的門檻。
總之,云計(jì)算是需要吃自己的狗食才能吃出來的,絕不是像手機(jī)上的Apps一樣,你想一想、試一試就能搞出來的,你首先需要讓自己有這樣的場(chǎng)景,有這樣的經(jīng)歷,你才可能會(huì)有這樣的經(jīng)驗(yàn)和能力。
云計(jì)算的市場(chǎng)細(xì)分
市場(chǎng)細(xì)分必然是市場(chǎng)來驅(qū)動(dòng)的。市場(chǎng)變化太快,說不清楚,不過大的方向應(yīng)該會(huì)是這樣的:有類是需要玩計(jì)算密集型的(比如大數(shù)據(jù)計(jì)算、網(wǎng)絡(luò)游戲),有類是需要玩IO密集型的(比如視頻網(wǎng)站),有類就是為了建網(wǎng)站的(比如電子商務(wù)、門戶網(wǎng)站、無線),有類是為了數(shù)據(jù)安全和保密的(比如金融數(shù)據(jù))。
從更高的層面來看,社會(huì)也需要分工。有的人賣土地,有的人賣房子,有的人裝修,有的人是中介。我相信沒人愿意把所有的賭注都押在一個(gè)地方。云計(jì)算也是一樣。上面也說過,無論IaaS、PaaS、SaaS,后面的S都是service,本質(zhì)上都是提供服務(wù)。所以,我認(rèn)為,市場(chǎng)的細(xì)分本質(zhì)上就是服務(wù)的細(xì)分。
看看歷史我們知道,細(xì)分永遠(yuǎn)是跟著行業(yè)走的,也是跟著業(yè)務(wù)走的,所以,在業(yè)務(wù)層會(huì)出現(xiàn)更多的細(xì)分。
對(duì)阿里云產(chǎn)業(yè)細(xì)分的看法
政府云、金融云不太清楚,不過我很清楚電商云——就是我之前負(fù)責(zé)的聚石塔。聚石塔時(shí)間不長,2012年9月正式上線,去年是大發(fā)展的一年,作為垂直云解決的很好。
天貓和淘寶做的都是下單前的東西,下單后,商家每天處理好幾百單,需要做訂單合并、篩選,有的商家規(guī)模不大但訂單很多。海爾有ERP,這些商家沒有,但是每天也1000多單,如果沒有信息化的系統(tǒng),人肉是處理不了的,必然要有ERP系統(tǒng)處理訂單。另外還要管理用戶,給用戶做營銷、發(fā)展忠實(shí)用戶。總之,都是賣東西以后的事情。咋辦?
淘寶天貓給了一堆開放API,你可以調(diào)我的API接入,在你那邊有ISV幫你做一套東西遠(yuǎn)程訪問淘寶API,把訂單拉過去,倉庫進(jìn)貨了之后,通過API把庫存改一下,就可以連起來了。天貓用戶下單,到他的系統(tǒng)、他的倉庫,他就發(fā)貨了,倉庫補(bǔ)完貨,在他的系統(tǒng)里一改,自動(dòng)就到天貓店了。這是電子信息化。
但是一到雙十一就受不了:訂單量太大。正好云平臺(tái)出現(xiàn)了,再怎么樣,阿里的運(yùn)維能力也要比你商家的要強(qiáng)吧。你看,聚石塔賣的是服務(wù),不是主機(jī)。另外是數(shù)據(jù)安全:商家的系統(tǒng)天天被黑客盯著,如果我們把用戶信息都給商家,不是所有的商家的系統(tǒng)安全都做得很好,內(nèi)部的人插個(gè)什么U盤,上面一堆木馬,數(shù)據(jù)就被偷走了。
偷走了之后,別人還說是阿里搞丟的,這當(dāng)然不行。所以,我們又要開放,還要保證安全,聚石塔這個(gè)云平臺(tái)就這樣出來的:你來我這兒,我才開放給你,因?yàn)榘踩苤匾?/p>
保證性能和安全也是商家的利益訴求也在里面,商家也不希望用戶數(shù)據(jù)被偷,他也希望雙十一能抗住。
另外,很多商家自己不會(huì)做,所以要ISV(第三方軟件開發(fā)商)來做,所以這個(gè)是賣解決方案,跟IBM很相似。銀行要一套系統(tǒng),IBM提供硬件和解決方案,系統(tǒng)集成商來幫銀行寫代碼和集成系統(tǒng)。聚石塔也很像,聚石塔提供API、ECS、數(shù)據(jù)庫,第三方的ISV進(jìn)來幫商家集成一個(gè)系統(tǒng)。這是很經(jīng)典的也是很傳統(tǒng)的IBM的玩法,只不過是玩在了云端。
你看,這也是做自己的長項(xiàng)做出來的細(xì)分市場(chǎng)。所以說,吃自己的狗食很重要。
對(duì)PaaS的看法
無論是Google的GAE還是新浪的SAE都是給個(gè)容器,給個(gè)容器的好處是不用管數(shù)據(jù)連接、CPU什么,程序一傳就能用,什么水平擴(kuò)展都不用管。
不爽的是,一個(gè)是在編程上限制太多:AppEngine總會(huì)閹割很多系統(tǒng)相關(guān)的功能,比如Java、PHP、Python的很多系統(tǒng)調(diào)用都閹割了,因?yàn)槿绻o你這些系統(tǒng)調(diào)用,你就可以突破沙箱;另一個(gè)是有故障的時(shí)候:技術(shù)人遇到問題都恨不得自己上去解決,想看看后面在忙啥,但是看不到,很無助,只能等你解決,就看你的人解決的好不好、快不快。
所以如果IaaS沒做好,運(yùn)維、故障自動(dòng)處理、遷移沒做好,出了問題用戶只能干瞪眼,PaaS必然不好用。當(dāng)然IaaS層也有這個(gè)問題,但是至少你還可以登到機(jī)器上看一看,大不了重啟一下。像AWS,你重啟一下就跑到別的物理機(jī),問題也許就解決了。
其實(shí),對(duì)于PaaS中間這層的確很尷尬。怎么解決?我覺得還是要依賴某種業(yè)務(wù)場(chǎng)景。單純一個(gè)平臺(tái)要閹割很多功能,搞得用戶不舒服,還不如干脆一步到位,根據(jù)業(yè)務(wù)場(chǎng)景給一個(gè)編程框架。
比如SAE可以就做微博app,上來就調(diào)API,數(shù)據(jù)庫都ready;或者微信如果做個(gè)PaaS,上面只玩微信公眾平臺(tái)上的東西,也可以。我覺得PaaS層更貼合業(yè)務(wù)會(huì)更成功。給新浪微博做個(gè)插件,你去買個(gè)VM、買數(shù)據(jù)庫?這種時(shí)候很需要PaaS。我覺得PaaS層要成功就要貼近業(yè)務(wù)場(chǎng)景。比如:騰訊的風(fēng)鈴系統(tǒng)(雖然不知道企業(yè)帳號(hào)看見是什么樣的),就做無線建站,這樣多好。干巴巴的PaaS有點(diǎn)高不成低不就。
對(duì)SDN的看法
SDN其意圖是想改變目前超級(jí)復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)。意圖是挺好的。想一想,如果以后我家的網(wǎng)絡(luò)不用因?yàn)橘I個(gè)新的路由器都要重新設(shè)計(jì)一把,只要一次設(shè)置,然后對(duì)所有的路由器都通過,的確是挺方便的,這點(diǎn)對(duì)企業(yè)非常好。不過,不知道在操作上怎么做,也許會(huì)從企業(yè)內(nèi)部開始這場(chǎng)革命,這個(gè)不得而知。
就像開車一樣,機(jī)械式的方向盤和剎車油門系統(tǒng)這么多年都沒什么變化,也提過很多更好更高科技的解決方案,但是傳統(tǒng)還是這樣延續(xù)下來了。所以,SDN真不知道未來會(huì)怎么樣。
總之,一個(gè)老的事物到一個(gè)新的事物需要有一個(gè)過程,這個(gè)過程中會(huì)出現(xiàn)很多過渡產(chǎn)品或是過渡方案,如果沒有這些過渡產(chǎn)品和方案,也就沒法達(dá)到新的事物。未來是什么樣,無法預(yù)知。
對(duì)私有云的看法
私有云跟公有云,都會(huì)存在。這跟人一樣,私人生活和公眾生活都會(huì)需要的。大公司有1萬、2萬人,這么多數(shù)據(jù),要存,需要一個(gè)很穩(wěn)定的解決方案。要穩(wěn)定可以買IBM,但是貴。云計(jì)算出來說,我可以寫三份,但他不想上公有云,我的數(shù)據(jù)放在別人那里,總感覺不好的,所以有了私有云做物理隔離,他覺得安全。
安全這個(gè)詞對(duì)應(yīng)兩個(gè)英文,security和safety,其實(shí)security和safety不一樣:云計(jì)算解決safety,保證數(shù)據(jù)不丟;寧可數(shù)據(jù)丟也不讓人看到,那是security。比如私人照片我更愿意存家里,有一個(gè)小的云存儲(chǔ),所有設(shè)備同步,跟老家父母同步,這樣比較好。放公網(wǎng)很恐怖。
一定會(huì)有公司不愿意上云的,比如金融方面的企業(yè),他們覺得互聯(lián)網(wǎng)不安全,他們要的更多的是安全。在公網(wǎng)上你的系統(tǒng)的安全攻防能力都要跟上,但如果物理不通的話就不用考慮的太復(fù)雜。
企業(yè)內(nèi)部私有云肯定有市場(chǎng)。你看,好些企業(yè)內(nèi)部目前還被EMC、IBM所壟斷著呢。計(jì)算機(jī)發(fā)展史就是廉價(jià)的東西取代昂貴的東西,所以私有云一定沒問題,而降低私有云的運(yùn)維復(fù)雜度、提供一個(gè)或多個(gè)方便的運(yùn)維系統(tǒng)和工具就是重中之重。其中,SDN之類的東西肯定會(huì)是其中一個(gè)很重要的一塊。
另外,還是那句話,云就是服務(wù),只要提供了好的服務(wù),無論公有還是私有都是會(huì)有價(jià)值的。
-
云計(jì)算
+關(guān)注
關(guān)注
39文章
7859瀏覽量
137861 -
存儲(chǔ)
+關(guān)注
關(guān)注
13文章
4353瀏覽量
86169 -
操作系統(tǒng)
+關(guān)注
關(guān)注
37文章
6892瀏覽量
123742
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論