無論您的服務(wù)器是在Windows還是Unix上運行,這些關(guān)鍵性能領(lǐng)域都可以作為任何服務(wù)器監(jiān)控策略的良好起點,跟蹤這些性能指標(biāo)作為性能瓶頸的指標(biāo)非常重要。那么如何監(jiān)控服務(wù)器性能?
1、中央處理器 (CPU) 和內(nèi)存
每當(dāng)服務(wù)器性能下降時,通常會懷疑服務(wù)器CPU利用率和內(nèi)存資源。如果您的服務(wù)器的CPU使用率異常高或內(nèi)存使用率很高(可用的可用內(nèi)存空間較少),您的應(yīng)用程序的性能將受到影響。
很高興知道服務(wù)器上最消耗 CPU 和內(nèi)存的進程是什么。這對于快速修復(fù)資源使用問題很重要。要測量的指標(biāo)包括 CPU 進程計數(shù)、CPU 線程計數(shù)和 CPU % 中斷時間。
您需要監(jiān)控服務(wù)器的內(nèi)存使用情況。這包括可用的可用內(nèi)存、寫入速率頁面以釋放物理內(nèi)存空間等。所有這些指標(biāo)都可以幫助您隨時了解服務(wù)器的運行狀況。
2、服務(wù)器正常運行時間
您的網(wǎng)站必須全天候運行并可用。服務(wù)器正常運行時間衡量系統(tǒng)運行的時間量。當(dāng)系統(tǒng)可能在不知不覺中重新啟動時,此指標(biāo)可用于提醒您。
如果您發(fā)現(xiàn)預(yù)期的服務(wù)器可用性周期與服務(wù)器正常運行時間數(shù)據(jù)之間存在差異,則系統(tǒng)至少發(fā)生了一次故障。確認(rèn)所有預(yù)計在系統(tǒng)發(fā)生故障時運行的計劃任務(wù)是否已完成。
3、磁盤活動
磁盤活動是磁盤驅(qū)動器主動處理請求所花費的時間。必須監(jiān)控幾個關(guān)鍵指標(biāo):
磁盤繁忙時間 - 測量磁盤處于活動狀態(tài)的時間百分比。如果這個值很高,這意味著你訪問磁盤的請求正在堆積。
輸入和輸出操作 (I/OP) – 指示磁盤驅(qū)動器上的工作負載。監(jiān)控此指標(biāo)有助于了解您的磁盤正在承受的工作負載。
磁盤讀/寫——測量從磁盤讀/寫數(shù)據(jù)塊所花費的時間。較低的值意味著性能良好。
磁盤隊列長度——衡量為隊列中的請求提供服務(wù)所花費的時間。為了獲得最佳性能,磁盤隊列長度應(yīng)該最小。
請注意,監(jiān)視磁盤的性能對于 I/OP 密集型任務(wù)非常重要。
4、頁面文件使用
未使用或未訪問的數(shù)據(jù)存儲在頁面文件中。超出操作系統(tǒng) (OS)有限隨機存取存儲器 (RAM)空間的操作也會發(fā)送到頁面文件中進行存儲。
當(dāng)您發(fā)現(xiàn)它的使用率很高時,這意味著系統(tǒng)的頁面文件不足以滿足您的服務(wù)器的需求。
另一個重要指標(biāo)是頁面交換。每當(dāng)您的服務(wù)器工作內(nèi)存不足時,都會保留一塊磁盤空間來臨時保存數(shù)據(jù),從而釋放更多空間。我們不建議頁面交換。通常,這意味著您沒有配置足夠的內(nèi)存來運行您的服務(wù)器。
請記住,頁面交換是內(nèi)存容量耗盡的短期解決方案。由于頁面交換減少了響應(yīng)時間,因此應(yīng)該避免這種情況。
5、上下文切換
上下文切換是一個密集的過程。它發(fā)生在內(nèi)核(計算機操作系統(tǒng)核心的計算機程序)將處理器從一個進程或線程切換到另一個時。每次發(fā)生上下文切換時都會使用 CPU 資源。所以當(dāng)發(fā)生大范圍的上下文切換時,會占用越來越多重要的 CPU 資源。
這是由運行多個繁忙進程或應(yīng)用程序錯誤導(dǎo)致的,這些錯誤會增加上下文切換的次數(shù)。服務(wù)器上上下文切換的突然增加可能表明存在問題。因此,監(jiān)視上下文切換對于服務(wù)器的性能至關(guān)重要。
6、時間同步
同一網(wǎng)絡(luò)上共享文件或相互通信的系統(tǒng)具有有時限的活動。那么,想象一下系統(tǒng)時鐘是否不同步?結(jié)果可能是災(zāi)難性的。
不準(zhǔn)確的時鐘可能會導(dǎo)致數(shù)據(jù)被覆蓋或產(chǎn)生版本沖突。更糟糕的是,它可能導(dǎo)致程序無法正常運行。始終根據(jù)參考時鐘監(jiān)控系統(tǒng)時鐘偏移。
7、處理用法
句柄是指應(yīng)用程序引用的資源。在您的服務(wù)器上運行的應(yīng)用程序請求和接收資源使用它們,然后將它們返回給操作系統(tǒng)。有時,由于程序錯誤,應(yīng)用程序“忘記”在使用后返回句柄。這是句柄泄漏。
請記住,服務(wù)器上的資源是有限的。隨著時間的推移,重復(fù)的句柄泄漏可能會“耗盡”服務(wù)器,從而導(dǎo)致服務(wù)器的性能下降。隨著時間的推移密切監(jiān)控和處理使用情況。如果打開句柄的數(shù)量急劇或持續(xù)增加,這可能意味著句柄泄漏。
您需要調(diào)查并確定罪魁禍?zhǔn)住D梢越K止此類進程或修補程序。
8、過程活動
可能存在應(yīng)用程序創(chuàng)建新進程而不停止先前啟動的進程的情況。跨這些進程的處理和多任務(wù)處理會給您的服務(wù)器帶來負擔(dān)。
結(jié)果,您的服務(wù)器性能將受到嚴(yán)重影響。確保應(yīng)用程序正確運行并正確退出。為此,您需要跟蹤和監(jiān)控服務(wù)器上的所有流程活動。
9、網(wǎng)絡(luò)流量
網(wǎng)絡(luò)活動監(jiān)控對于衡量服務(wù)器性能至關(guān)重要。每個網(wǎng)絡(luò)接口都提供網(wǎng)絡(luò)活動負載的指示。如果帶寬使用量接近網(wǎng)絡(luò)接口的最大速度,這可能表明存在瓶頸。
通過持續(xù)監(jiān)控網(wǎng)卡上的輸入和輸出 (I/O)活動,您可以發(fā)現(xiàn)可能的硬件故障或過載。您還可以規(guī)劃硬件要求以確保最佳服務(wù)器性能。
10、TCP 活動
您的應(yīng)用程序是面向連接的。他們使用TCP作為傳輸協(xié)議。HTTP、SQL、SMTP 在下面使用 TCP。如果 TCP 層性能下降,應(yīng)用程序的性能也會下降。
有幾個重要的指標(biāo)有助于監(jiān)控 TCP:
進出服務(wù)器的連接速率有助于指示服務(wù)器工作負載。
服務(wù)器上的連接斷開數(shù)。高數(shù)字可能表明存在問題。
重傳百分比——當(dāng)服務(wù)器沒有收到來自客戶端的確認(rèn)時發(fā)生重傳。超時后,服務(wù)器必須再次發(fā)送傳輸。為確保良好的 TCP 性能,請盡量減少重傳。請記住,重復(fù)重傳可能會導(dǎo)致吞吐量嚴(yán)重下降。
11、操作系統(tǒng)日志文件
監(jiān)控服務(wù)器運行狀況的最常用方法可能是操作系統(tǒng)日志,因為它們包含錯誤詳細信息、崩潰和其他類型的異常,可幫助您解決任何問題。
雖然Windows提供系統(tǒng)、安全和應(yīng)用程序日志文件,但Unix將系統(tǒng)日志和 cron 日志文件存儲在 /var/log 目錄中。定期對日志事件進行監(jiān)控、分析和警報有助于提醒您注意任何服務(wù)器異常。
審核編輯 黃昊宇
-
監(jiān)控
+關(guān)注
關(guān)注
6文章
2234瀏覽量
55366 -
服務(wù)器性能
+關(guān)注
關(guān)注
0文章
3瀏覽量
7048
發(fā)布評論請先 登錄
相關(guān)推薦
評論