資料介紹
軟件簡介
夜鶯(Nightingale)是一個企業級監控解決方案。旨在滿足云原生時代企業級的監控需求。Nightingale 在產品完成度、系統高可用、以及用戶體驗方面,達到了企業級的要求,可滿足不同規模用戶的場景,小到幾臺服務,大到數十萬都可以完美支撐。兼顧云原生和裸金屬,支持應用監控和系統監控,插件機制靈活,插件豐富完善,具有高度的靈活性和可擴展性。
Nightingale 在?Open-Falcon?的基礎上,結合滴滴內部的最佳實踐,在性能、可維護性、易用性方面做了大量的改進,作為集團統一的監控解決方案,支撐了滴滴內部數十億監控指標,覆蓋了從系統、容器、到應用等各層面的監控需求,周活躍用戶數千。五年磨一劍,取之開源,回饋開源。
Nightingale 采用樹狀節點導航,我們稱之為對象樹。對象樹本質上是一種對監控對象的分組管理機制,方便查找和查看監控對象,以及對監控對象設置監控策略等管理動作。 一棵典型的樹可從上到下描述為組織架構關系、產品服務模塊關系、機房和機器掛載關系,該導航樹可根據用戶需求自行靈活定制。
監控策略應用到某個節點后,該節點下的所有子節點掛載的所有的機器都會應用這個策略,任何一臺機器觸發相關閾值都會產生告警。
監控大盤的定制做了大幅易用性改進,支持了圖表閾值,支持了圖表分類,新增圖表和排序管理都是可見即所得的方式,巡檢大盤的定制從此不再是困難。
Nightingale 是在 Open-Falcon 的基礎上衍化發展而來,Open-Falcon 作為國內使用最廣泛的監控解決方案之一,為 Nightingale 的設計開發提供了大量的借鑒意義。
與 Open-Falcon 的不同點
- 告警引擎重構:Open-Falcon 的告警策略,在監控數據推送上來的同時會觸發策略判斷,這種「推」的模式優勢是策略的判斷時效性非常高,但是不利于更高級的告警策略的支持和擴展,比如多條件的組合報警就很難支持。Nightingale 轉為推拉結合模式,通過推模式保證大部分策略判斷的效率,通過拉模式支持了與條件告警和nodata告警。
- 引入了導航對象樹:將 Open-Falcon 采用的扁平 HostGroup,轉為 Nightingale 的導航對象樹,對象樹本質上是一種對監控對象的分組管理機制,方便查找和查看監控對象,以及對監控對象設置監控策略等管理動作。 同時在 Nightingale 中,去除了告警模板的概念,告警策略直接與樹節點綁定,簡化設計,大幅提升靈活度和易用性。
- 索引模塊升級換代:Open-Falcon 使用 MySQL 存儲 metrics 的索引數據,在擴展性和靈活性上存在瓶頸。Nightingale 根據監控需求,設計開發了全新的內存索引模塊 index,查詢方式更多樣,查詢效率更高,避免了原來 MySQL 索引數據達到億級別時面臨的維護優化工作。
- 時序數據庫優化:在 Open-Falcon 存儲模塊 Graph 的基礎上,引入 Facebook 的 Gorilla 壓縮方案,近期幾個小時的數據采用內存存儲,大幅提升數據查詢效率,長期數據仍然使用 rrdtool 數據格式存儲在硬盤上。同時進一步完善了時序數據庫的性能和穩定性。
- 告警引擎高可用改進:告警引擎 judge 模塊通過心跳機制做到了故障自動摘除,再也不用擔心單個 judge 宕機導致部分策略失效,需要人工介入的問題,index 模塊也是采用類似方式保證可用性。
- 原生內置日志監控功能:Nightingale 客戶端原生內置了日志匹配和指標抽取能力,在 web 控制臺頁面上支持了日志匹配規則的配置,同時也支持讀取目標機器特定目錄下的配置文件的方式,讓業務指標監控更為易用。
- 可運維性增強:將 portal (falcon-plus 中的 api)、uic、dashboard、hbs、alarm 合并為一個模塊:monapi,簡化了系統整體部署難度,原來的部分模塊間調用變成進程內方法調用,性能更高。
- 配置文件中心化:配置文件做了易用性改造,抽取數據庫通用配置到 mysql.yml,抽取端口實例地址等關聯配置到 address.yml,大批配置在代碼里給了默認值,使得配置文件更清晰,易于維護。
與 Open-Falcon 的相同點
- 數據模型沒有變化,仍然是 metric、endpoint、tags 的組織方式,agent 基本是可以復用的,Nightingale 中的 agent 叫 collector,融合了原來 Open-Falcon 的 agent 和 falcon-log-agent 的邏輯,各種監控插件也都是可以復用的。
- 數據流向和整體處理邏輯是類似的,仍然使用靈活的推模型,分為數據存儲和告警判斷兩條鏈路。
Nightingale 架構?
- collector即agent,可以采集機器常見指標,原生支持日志監控,支持插件機制,支持業務通過接口直接上報數據;
- transfer提供rpc接口接收collector上報的數據,然后通過一致性哈希,將數據轉發給多臺tsdb和多臺judge;
- tsdb即open-falcon中的graph組件,用于存儲歷史數據,支持配置為雙寫模式提升系統容災能力,tsdb會把監控數據轉發一份給index建索引;
- index是內存索引模塊,替換原來的mysql方案,在內存里構建索引,便于后續數據檢索,在檢索的靈活性和檢索性能方面大幅提升;
- judge是告警引擎,從monapi(portal)同步監控策略,然后對接收到的數據做告警判斷,如滿足閾值,則生成告警事件推送到redis隊列;
- monapi(alarm)從redis隊列中讀取judge生成的事件,進行二次處理,補充一些元信息,生成告警消息,重新推送回redis隊列;
- 各發送組件,比如mail-sender、sms-sender等,從redis讀取告警消息,發送告警,抽象出各類sender是為了后續定制方便;
- monapi集成了原來多個模塊的功能,提供接口給js調用,api前綴為/api/portal,數據查詢走transfer,去除了 open-falcon 中原來的query組件,api前綴為/api/transfer,索引查詢的api前綴/api/index,于是,在前端統一搭建nginx,即可通過不同location將請求轉發到不同后端;
- 數據庫仍然使用MySQL,主要存儲的內容包括:用戶信息、團隊信息、樹節點信息、告警策略、監控大盤、屏蔽策略、采集策略、部分組件心跳信息等;
仍在進行中的工作?
- 提供監控指標聚合組件,現在的架構可以解決機器級、模塊級的監控,但是集群維度的監控指標,是需要聚合整個集群的所有模塊、機器的指標,做一些加和、求平均之類的操作,相關聚合組件,我們在緊鑼密鼓的開源過程中;
- 與k8s無縫集成的工作,也在進行之中;
- 完善更多監控插件,之前Open-Falcon社區里的很多插件都是可以直接用的,我們會盡量補充社區沒有的插件,并對社區已有的插件,進行二次整理和維護,讓Nightingale周邊更完善;
聯系我們?
- 我們的官網是?https://n9e.didiyun.com,相關文檔會首發于此。
- 您可以在?Github?上關注?Nightingale,歡迎您試用和參與社區。
- 您可以通過滴滴云的夜鶯鏡像,一鍵安裝和體驗。
致謝和說明
- Open-Falcon?是小米運維團隊開源的企業級監控解決方案,在國內廣泛使用。
- Nightingale?采用 Apache-2.0 開源協議,Copyright ? 滴滴 2020。
- 工業物聯網數據采集及監控解決方案
- Ansible企業級自動化運維探索的詳細資料說明 2次下載
- 基于對等監控網絡實現云監控系統解決方案 0次下載
- 基于RIASOA的企業級應用系統研究崔楠 0次下載
- 基于企業級信息集成平臺的數據存儲備份系統的構建_王永平 0次下載
- 企業級路由器和家用路由器的區別 29次下載
- All_Flash_FAS_閃存性能絕配_功能豐富的企業級存儲 0次下載
- 閃存加速與云就緒:企業級應用對存儲提出的全新要求 0次下載
- 安全監控系統解決方案 0次下載
- 箱式門禁監控解決方案 0次下載
- 無線傳輸視頻監控解決方案 198次下載
- 大型企業園區聯網監控解決方案 30次下載
- 企業級證券信息系統平臺(ECSN)
- 基于Domino的企業級工作流引擎
- 基于Struts2企業級異常處理研究及擴展
- Nightingale夜鶯監控部署安裝和使用 3078次閱讀
- 企業級SSD性能和功耗模型 1841次閱讀
- 浪潮信息企業級SSD:如何在PCIe生態下,提升NAND信號質量 1126次閱讀
- 詳解Zabbix分布式監控平臺建設 888次閱讀
- 選擇AlmaLinux作為CentOS替代方案的一些原因 2345次閱讀
- 淺談企業級應用的SLA對云服務的挑戰 1273次閱讀
- 基于FPGA的PSM實現解決企業級應用的閃存問題 997次閱讀
- 技術 | 傳感器性能如何支持狀態監控解決方案? 2929次閱讀
- 憶芯科技利用Veloce 硬件加速仿真平臺進行高速企業級固態硬盤存儲設計 1815次閱讀
- 解析SD-WAN技術,企業級廣域網未來之秀! 1404次閱讀
- 基于ARM的無線視頻監控系統的解決方案 2606次閱讀
- SLOC技術提供高清網絡安防監控解決方案 2061次閱讀
- 常見企業級SSD故障電源可靠性分析詳解 3978次閱讀
- Micron用于PCIe插槽的2.5英寸企業級SSD解決方案 2592次閱讀
- 淺談車載視頻監控系統解決方案發展 2885次閱讀
下載排行
本周
- 1A7159和A7139射頻芯片的資料免費下載
- 0.20 MB | 55次下載 | 5 積分
- 2PIC12F629/675 數據手冊免費下載
- 2.38 MB | 36次下載 | 5 積分
- 3PIC16F716 數據手冊免費下載
- 2.35 MB | 18次下載 | 5 積分
- 4dsPIC33EDV64MC205電機控制開發板用戶指南
- 5.78MB | 8次下載 | 免費
- 5STC15系列常用寄存器匯總免費下載
- 1.60 MB | 7次下載 | 5 積分
- 6模擬電路仿真實現
- 2.94MB | 4次下載 | 免費
- 7PCB圖繪制實例操作
- 2.92MB | 2次下載 | 免費
- 8零死角玩轉STM32F103—指南者
- 26.78 MB | 1次下載 | 1 積分
本月
- 1ADI高性能電源管理解決方案
- 2.43 MB | 452次下載 | 免費
- 2免費開源CC3D飛控資料(電路圖&PCB源文件、BOM、
- 5.67 MB | 141次下載 | 1 積分
- 3基于STM32單片機智能手環心率計步器體溫顯示設計
- 0.10 MB | 137次下載 | 免費
- 4A7159和A7139射頻芯片的資料免費下載
- 0.20 MB | 55次下載 | 5 積分
- 5PIC12F629/675 數據手冊免費下載
- 2.38 MB | 36次下載 | 5 積分
- 6如何正確測試電源的紋波
- 0.36 MB | 19次下載 | 免費
- 7PIC16F716 數據手冊免費下載
- 2.35 MB | 18次下載 | 5 積分
- 8Q/SQR E8-4-2024乘用車電子電器零部件及子系統EMC試驗方法及要求
- 1.97 MB | 8次下載 | 10 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935121次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關降壓/升壓雙向直流/直流轉換器 PCB layout 設計
- 1.48MB | 420062次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233088次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191367次下載 | 10 積分
- 5十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183335次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81581次下載 | 10 積分
- 7Keil工具MDK-Arm免費下載
- 0.02 MB | 73810次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65988次下載 | 10 積分
評論
查看更多