那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

使用NetQ實現全網可觀察性排除網絡故障

星星科技指導員 ? 來源:NVIDIA ? 作者:Michael Kashin ? 2022-04-17 10:25 ? 次閱讀

EVPN已成為現代數據中心架構的標準解決方案。對于終端用戶來說,受益于基于BGP的控制平面所具有的穩定性,EVPN提供了擴展其廣播域的靈活性。但這些增加的益處是以提高配置的復雜性為代價的。

當前所面對的不再是相對固定、簡單,可以通過維護人員直觀分析來發現錯誤的網絡配置。真正的生產性EVPN配置可能包括多個深度嵌套結構,而且隨網絡中的租戶數量成比例增長。

EVPN配置復雜性可以且必須通過適當的自動化解決方案予以解決,這可以減少人為出錯的可能性,而NVIDIA Cumulus Linux正是解決該問題的合適解決方案。但僅有自動化還不夠,錯誤仍然可以通過數據源引入系統,例如配置管理數據庫(CMDB)的人為錯誤。

可觀察性的重要性

這就是為什么對于任何具有合理復雜程度的基礎設施,用戶應該有辦法來采集各類日志、指標,并且調試、輸出、匯總、關聯和處理這些信息,從而嘗試推斷系統的內部狀態。實現這一點的能力通常被稱為系統的“可觀察性”,而且隨著底層基礎設施復雜性的增加,它正變得日益重要。在CNCF云原生環境 中,“可觀察性和分析”部分不斷增長的項目數量已證明了這一全行業趨勢。對此,NVIDIA也持同樣的觀點。

poYBAGJberaAJ0rLAADZzd8xRh8409.png

圖 1 數據中心演進

通過NetQ實現的全網可觀察性

長期以來,整個網絡的可觀察性僅限于拓撲視圖——有些圖包括從物理鏈接到L2,L3接口再到控制平面協議等不同層次的細節。但這些代表高層次意圖的圖只有在有人維護時才能保證準確。它們永遠無法反映每個設備中所包含的網絡的實際狀態。NetQ在設計上解決了這些問題并為整個網絡的運行狀態提供了一個統一的觀察窗口。

一方面,NetQ從其遠程代理處收集和匯總多項指標,這些代理可能運行在網絡交換機、通用計算服務器等任何位置。這些指標包括但不限于:接口統計和利用率、LLDP、MAC、ARP/ND和IP路由表、BGP、MLAG和OSPF的控制面狀態,以及用于幫助診斷任一數據平面丟包的故障快照(What Just Happened)事件。

另一方面,NetQ使用這些指標來推斷網絡的內部狀態并作出針對協議的診斷。這些檢查包括從簡單的MTU和鏈路狀態一致性到BGP和EVPN狀態驗證再到端到端連接性測試。

故障排除演示

在這篇文章中,將演示如何使用NetQ來排除一些使用以下拓撲結構的常見配置錯誤。葉節點被配置為MLAG對,并且該結構內部正在運行帶有對稱IRB的EVPN和基于PIM的BUM復制 。

pYYBAGJbereAEVLbAADJpTIgeMY040.png

圖 2 NVIDIA 空氣中的拓撲

環境設置

該測試拓撲結構可以在名為NVIDIA Air的云基礎設施模擬平臺上啟動。如要了解更多信息,請參閱《NVIDIA Air用戶指南》。

1、選擇創建模擬、演示市場和使用NetQ的網絡故障排除選項卡。

在接下來的部分中,將討論各種故障排除情景,并展示NetQ如何幫助確定問題的來源。

情景1:服務器01無法與服務器02通信

第一個問題很簡單:兩臺服務器都連接到同一對葉節點交換機上,因此需要檢查的地方僅限于以下幾個方面:

所有服務器鏈接的L1和Bond接口配置

peerlink的MLAG狀態和配置

vlan 10和vlan 20的L3和VRR接口配置

通過NetQ,只需點擊幾下就可以完成所有這些檢查。

1、在模擬頁面,選擇啟動NetQ,輸入用戶名和密碼

2、在工作臺標題中,選擇驗證并創建一個新的MLAG驗證。

poYBAGJberiAUYTRAACgjYzzLkI801.png

圖 3 情景 1 結果

當驗證完成后,NetQ發現雙宿設備有四個錯誤。對于每一個出現錯誤的檢查,用戶都可以查看更詳細的信息并了解NetQ認為的錯誤是什么。

pYYBAGJberiAP0UWAADV9rGGj0g820.png

圖 4 場景# 1 詳細信息

在本情景中,NetQ清楚地指向接口bond1的VLAN配置,現在可以通過登錄和比較兩臺葉節點交換機上的配置來進行快速驗證和糾正。

用戶可按照實驗指導來依次解決問題。

第二個情景涉及VXLAN EVPN結構上的VLAN內通信。這種故障的常用故障排除流程可能涉及以下步驟:

1、確認所有BGP會話都已建立,并且所有對等層的EVPN地址族都已啟用。

2、確認所有四個葉節點交換機上的VLAN至VNI映射是一致的。

3、確保導出和導入所需的Type-2路由使用同一組路由目標。

4、檢查BGP是否被配置為發布所有已配置的VNI。

必須在所有葉節點交換機上比較這些數值。下面將展示用NetQ檢查上述信息有多么簡單。

1、在主工作臺標題選擇選項卡并打開EVPN會話選項卡。

2、在全屏視圖中打開此選項卡,查看所有會話屏幕(圖5)。

情景2:服務器01無法與服務器04通信

poYBAGJbermAfnM5AAEx2HzVOIU629.png

圖 5 場景# 2 詳細信息

現在可以在屏幕上看到所有的相關值,這些值以表格的形式呈現并且可以進行排序及過濾以縮小搜索范圍。在該情景中,很容易發現葉節點01/02和葉節點03/04之間Vlan10的VNI映射差異。

用戶可按照實驗指導依次解決問題。

情景3:服務器01無法與服務器05通信

最后一個情景涉及VXLAN EVPN的VLAN間對稱路由。這次,需要驗證的內容有所增加,包括以下額外步驟:

每個VRF的BGP配置和會話狀態

EVPN 5型路由在葉節點交換機之間的傳播

檢查L3 VNI的配置是否一致以及每個MLAG對是否有唯一的Router MAC

L3 VNI到VRF在所有交換機上的映射

通過NetQ EVPN驗證功能,所有這些假設都可以在幾秒鐘內得到驗證。

1、在主工作臺標題中選擇驗證并創建一個新的按需EVPN驗證。幾秒鐘后,用戶即可看到結果(圖6)

poYBAGJberqAGQUBAAClzuIlf2s179.png

圖 6 情景# 3 結果

通過點擊VRF一致性警告,用戶可以清楚地看到錯誤位置。解決問題的時間縮短到幾秒鐘,管理員現在可以繼續糾正葉節點03/04上的VNI至VRF映射。

pYYBAGJberuARagmAACxAkqRBLI404.png

圖 7 場景# 3 詳細信息

請查看實驗室指南,了解解決這個問題所需的具體指令。

總結

在這篇文章中,展示了NetQ根據管理設備采集的各種指標來分析和推斷網絡狀態的能力。以上三個情景展示了如何利用NetQ的驗證和協議專用選項卡將根本原因分析的時長從幾分鐘或幾小時縮短到幾秒鐘。這些驗證可以按需求運行,也可以定期運行,甚至可以在過去的數據上運行,這是因為所有日志都存儲在一個時間序列數據庫中。

NetQ的能力遠遠超出了這篇文章中所展示和討論的內容,并且其功能還包含設備庫存、軟件生命周期管理、基于閾值的警報以及與第三方平臺(如Slack、PagerDuty和Grafana)的集成。NetQ將繼續擴展并增加更多的功能和第三方集成,在未來為用戶創造更多價值。

關于作者

Michael Kashin 是 NVIDIA 網絡組的解決方案架構師,專注于數據中心、自動化和可觀測性。他對軟件開發、網絡和云本地技術有著濃厚的興趣,并熱衷于利用自己的知識和專長幫助客戶解決業務問題。在 2021 年加入 NVIDIA 之前, Michael 曾為多家技術供應商工作,幫助他們的客戶構建云并開發基礎設施管理軟件。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5076

    瀏覽量

    103722
  • 服務器
    +關注

    關注

    12

    文章

    9304

    瀏覽量

    86062
  • 數據中心
    +關注

    關注

    16

    文章

    4858

    瀏覽量

    72381
收藏 人收藏

    評論

    相關推薦

    RS-485網絡故障查找與排除

    RS-485網絡故障查找與排除盡管更加現代化的替代技術日益增多,但RS-485技術仍然在無數的通信網絡中保持著中流砥柱的地位。以下是檢查常見故障和建立比較麻煩的RS-485
    發表于 02-26 15:37

    集中式網絡故障診斷

    集中式網絡故障診斷
    發表于 08-08 14:22

    使用Percepio的Tracealyzer和DevAlert實現FreeRTOS的可觀察

    時間線、事件日志、CPU負載圖、內存使用情況、任務依賴關系和許多其他有用的可視化結果。這些功能有助于實現可觀察。您可以在FreeRTOS應用程序的深層追蹤任務以及內核API調用。下圖是在筆記本電腦上運行
    發表于 05-18 13:41

    巧用Ping和Traceroute命令排除網絡故障

    在分析Ping 和Traceroute 命令工作原理和影響因素的基礎上,詳細介紹了使用Ping 和Traceroute 命令檢查網絡連接、查看信息路徑從而排除網絡故障的方法和技巧。p
    發表于 08-11 08:25 ?35次下載

    局域網網絡故障排除策略

    局域網網絡故障排除策略 【簡 介】當我們組建好了一個小型網吧后,為了使網吧運轉正常,網絡維護就顯得很重要了。由于網絡協議和網絡設備的復雜
    發表于 08-01 10:53 ?447次閱讀

    筆記本網絡故障排除

    電子發燒友為您提供了筆記本網絡故障排除,幫助你解決 筆記本 出現網絡故障時對您的干擾,希望對您有所幫助!
    發表于 07-11 16:11 ?195次下載
    筆記本<b class='flag-5'>網絡故障</b><b class='flag-5'>排除</b>

    朗訊ATM網絡故障案例分析

    朗訊ATM網絡故障案例分析
    發表于 09-05 09:22 ?3次下載

    智能網絡故障管理系統

    當前網絡故障管理系統正朝著自動化智能化的方向發展。為了提高傳統網絡故障管理系統的智能化水平,基于專家系統規則引擎Jess和SNMP協議,設計了一個智能網絡故障管理系統。該系統可實時監控被管網絡
    發表于 11-11 15:47 ?4次下載
    智能<b class='flag-5'>網絡故障</b>管理系統

    16個網絡工程師常用的網絡故障排除工具

    網絡故障排除對于網絡技術專家和網絡工程師是頗具挑戰的工作。每當添加新的設備或網絡發生變更時,新的問題就會出現,而且很難確定問題出在哪里。每一
    的頭像 發表于 08-25 11:37 ?1.1w次閱讀

    NVIDIA NetQ使網絡工作流程更易于故障排除和自動化

    NVIDIA NetQ 是一種高度可擴展的現代網絡操作工具,為 NVIDIA Spectrum Ethernet 平臺提供可操作的可見性。它將高級遙測技術與用戶界面相結合,使網絡工作流程更易于
    的頭像 發表于 06-15 10:44 ?1443次閱讀

    網絡故障排查思路和處理方法

    網絡故障是最容易出現的,且難以解決的問題。本文提供的網絡故障排查思路和處理方法,可解決日常工作中大部分網絡問題。
    發表于 10-31 09:14 ?1w次閱讀

    虹科分享 | NetFlow數據能夠為網絡故障排除提供什么? | 網絡流量監控

    虹科分享NetFlow數據能夠為網絡故障排除提供什么?NetFlow是網絡設備中標準化的功能,用于收集流量測量值并將其導出到另一個系統進行分析。對該流數據的分析通知網絡管理器
    的頭像 發表于 04-20 09:26 ?677次閱讀
    虹科分享 | NetFlow數據能夠為<b class='flag-5'>網絡故障</b><b class='flag-5'>排除</b>提供什么? | <b class='flag-5'>網絡</b>流量監控

    RJ45網絡故障排除技巧 RJ45網線的長度對信號影響

    RJ45網絡故障排除技巧 在網絡故障排除中,RJ45網線是連接設備的關鍵部分。了解RJ45網線的特性和可能的問題可以幫助我們更有效地解決網絡
    的頭像 發表于 12-17 15:31 ?610次閱讀

    網絡故障排除基本指南

    本文提供了一份關于網絡故障排除的全面指南,涵蓋了故障排除的基本步驟和技巧,強調了獲得全面可見性的重要。通過詳細的分析和實際案例,您將學習如
    的頭像 發表于 01-14 17:49 ?176次閱讀
    <b class='flag-5'>網絡故障</b><b class='flag-5'>排除</b>基本指南

    光通信網絡故障排除技巧

    光通信網絡以其高速、大容量和抗干擾在現代通信系統中占據著舉足輕重的地位。然而,隨著網絡規模的擴大和復雜的增加,故障
    的頭像 發表于 01-23 09:42 ?107次閱讀
    菲利宾百家乐官网现场| 百家乐娱乐网77scs| 六合彩网站| 百家乐官网翻天qvod粤语| 百家乐博彩资讯论坛| 一路发娱乐| 百家乐筹码素材| 棋牌娱乐| 百家乐官网平注法亏损| 大发888注册网址| 百家乐玩法| 百家乐手机投注平台| 百家乐游戏机| 百家乐微笑投注| 百家乐官网几点开奖| 百家乐视频聊天游戏| 阿尔山市| 百家乐平注胜进与负追| 百家乐官网最好的投注法| 百家乐最新庄闲投注法| 百家乐官网存在千术吗| 澳门百家乐网站bt| 百家乐官网的必赢方法| 二爷百家乐的玩法技巧和规则| 网上百家乐官网骗人的吗| CEO百家乐的玩法技巧和规则| 百家乐官网五子棋| 大发888娱乐代理| 金牌百家乐官网的玩法技巧和规则 | 方形百家乐筹码| 皇冠网上投注网| 百家乐真钱送彩金| 百家乐官网开户最快的平台是哪家 | 百家乐官网赚钱项目| 百家乐计划工具| 百合百家乐官网的玩法技巧和规则 | 养狗对做生意风水好吗| 百家乐官网视频象棋| 百家乐平注法口诀技巧| 24楼层风水好吗| 百家乐官网怎么压对子|