那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

CXL.mem是什么?

安芯教育科技 ? 來源:安芯教育科技 ? 作者:安芯教育科技 ? 2022-11-02 09:45 ? 次閱讀

3.3 CXL.mem

3.3.1 介紹

CXL內存協議被稱作CXL.mem。CXL.mem定義了CPU和內存之間的傳輸接口。該協議可用于多個不同的內存連接選項,包括當內存控制器位于主機CPU中時,或當內存控制器位于加速器設備內時,或當內存控制器移動到內存緩沖芯片時。

CPU中的一致性引擎使用CXL.mem請求和響應與內存接口。在此配置中,CPU一致性引擎被視為CXL.mem主設備(Master),內存設備被視為CXL.mem從設備(Subordinate)。主設備負責向從設備發起讀寫請求,從設備負責響應主設備的讀寫請求。

當從設備是一個加速器時,CXL.mem協議認為設備內部也有一個一致性引擎(Device Coherency Engine,簡稱DCOH)。

從Master到Subordinate的CXL.mem事務被稱作M2S;反過來,從Subordinate到Master的事務稱作S2M。

M2S事務只有兩種消息類型:

無數據的請求(Req)

有數據的請求(RwD)

對應的,S2M事務也只有兩種類型:

無數據的響應(NDR)

有數據的響應(DRS)

3.3.2 內存QoS遙測

內存QoS遙測是內存設備的一種機制,用于在CXL.mem請求的每個響應消息中指示其當前負載級別(DevLoad)。這使主機能夠根據負載級別來衡量對部分設備、單個設備或設備組的CXL.mem請求的速率,從而優化這些內存設備的性能,同時限制結構擁塞。

插播一句,QoS是Quality of Service的縮寫,翻譯過來就是服務質量。對于內存系統而言,帶寬和延時受到一定的限制,如何向其它的模塊提供服務是一個系統問題。SoC有的模塊可能帶寬需求不大,但是對于延時要求很高,比如顯示模塊。而有的模塊對于帶寬要求很大,但是延時可以略高,比如數據處理器。如果對SoC所有模塊的內存需求一視同仁,可能影響整個系統的運行。利用QoS機制,可以對每個模塊的內存訪問排列順序,達到內存系統的最佳利用。

內存QoS遙測內容比較繞,我也沒看太懂,暫時略過,不影響CXL的學習。

3.3.3 M2S請求(Req)

Req消息是無數據請求,消息字段定義如下:

186a0bf4-5a4d-11ed-a3b6-dac502259ad0.png

各字段的編碼和詳細解釋就不貼圖了,如果有需要,大家可以去協議里面查找。

3.3.4 M2S帶數據請求(RwD)

RwD是有數據請求,消息字段定義如下:

18ac9eb0-5a4d-11ed-a3b6-dac502259ad0.png

3.3.5 S2M無數據響應(NDR)

NDR消息類包含從Subordinate到Master的完成和指示,不帶數據。

1950206c-5a4d-11ed-a3b6-dac502259ad0.png

3.3.6 S2M數據響應(DRS)

DRS消息類包含從Subordinate到Master讀取的內存數據。

19752dbc-5a4d-11ed-a3b6-dac502259ad0.png

3.3.7 轉發和排序規則

在多跳互連網絡中,Req和RwD消息的每一跳都需要信用值

如果請求和MemRdFwd或MemWrFwd指向相同的緩存行地址,則M2S Req通道中的CXL.mem請求不能發送MemRdFwd或MemWrFwd

NDR和DRS消息需要在源位置預先分配

在CXL.mem上,只有在寫入完成后,寫入數據才能保證對以后的訪問可見

CXL.mem請求需要在設備上進行轉發,而不依賴于任何設備啟動請求

緩存行的M2S和S2M數據傳輸不能與其它緩存行交織

3.4 事務順序總結(Transaction Ordering Summary)

沒什么重要內容,暫時略過。

3.5 到設備掛載內存(DAM)的事務流

3.5.1 Type 1和Type 2的事務流

3.5.1.1 注釋和假設

下面的示意圖做了如下假設:

設備內部有一個設備一致性引擎,稱作DCOH

DCOH里包含一個監聽過濾器,是用來追蹤監聽設備的緩存

DCOH有一個偏置表查找機制,具體實現依賴于設備

設備特定的流程,如下圖紅色箭頭所示,不需要完全遵守下圖,具體實現取決于設備

197ecd04-5a4d-11ed-a3b6-dac502259ad0.png

3.5.1.2 主機請求

主機發起的可緩存讀(Cacheable read)示例如下圖。主機請求獲得一個緩存行的非獨占副本。主機發送MemRd,SnpData給設備,設備DCOH接收到SnpData,在偵聽過濾器中查找此緩存行。如果SF Hit(圖中綠色字體),設備將該緩存行狀態從Exclusive變為Shared(圖中綠色字體)。隨后將數據和響應發給DCOH,DCOH收到之后,回復Cmp-S給主機,然后將數據通過MemData發送給主機。

1988022a-5a4d-11ed-a3b6-dac502259ad0.png

CXL協議中還給了好幾個示例,就不一一貼上了。

3.5.1.3 設備請求(主機偏向和設備偏向)

到設備掛載內存的設備讀取示例如下圖,包含兩個流程分支。第一個,設備向設備掛載的內存發起讀請求,由于配置成主機偏向(圖中的紫色字體),設備要向主機發送一致性請求。主機在解析完一致性后,在CXL.mem上發送MemRdFwd以完成事務,此時設備可以在內部完成讀取。第二個,配置成設備偏向,設備讀取可以在設備內完成,不需要向主機發送請求。

19958670-5a4d-11ed-a3b6-dac502259ad0.png

同樣的,后面還有幾個流程示例,先不貼了。

3.5.2 Type2和Type 3的內存流

為了支持節省延遲,CXL.mem包含一個推測性內存讀取命令(MemSpecRd),用于在主代理解決一致性之前啟動內存訪問。解決完一致性問題后,主機可能會發出請求讀取(MemRd,MemRdOwn),設備應與較早的MemSpecRd合并以節省延遲,見下圖。為了避免性能影響,建議將MemSpecRd命令視為低優先級,以避免其它正常請求訪問增加延遲。

19c0aa76-5a4d-11ed-a3b6-dac502259ad0.png

3.6 Type 3設備的事務流

Type 3設備是內存擴展器,它既不緩存主機內存,也不需要主機主動管理設備緩存。因此,Type 3設備沒有DCOH代理。主機將這些設備視為分解的內存控制器。到Type 3設備的事務流簡化為兩個類,即讀和寫。

M2S讀取Type 2設備與Type 3設備的關鍵區別在于,Type 3設備沒有S2M NDR響應消息。與Type 2設備一樣,向Type 3設備的寫入完成也需要S2M NDR Cmp消息

19cdf474-5a4d-11ed-a3b6-dac502259ad0.png

19f6e924-5a4d-11ed-a3b6-dac502259ad0.png

本章總結:這一章的內容極多,很多地方看的也是暈頭轉向,先搭個架子在這,以后有需要或者有時間再來仔細研究。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    10905

    瀏覽量

    213033
  • 內存控制器
    +關注

    關注

    0

    文章

    40

    瀏覽量

    8941

原文標題:技術分享 | CXL學習(五)

文章出處:【微信號:Ithingedu,微信公眾號:安芯教育科技】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    內存擴展CXL加速發展,繁榮AI存儲

    .cache和CXL.memory三個子協議,分別處理I/O、緩存一致性和內存訪問。PCIe物理層為CXL高效的數據傳輸提供技術底座,CXL.cache和CXL.mem
    的頭像 發表于 08-18 00:02 ?5029次閱讀
    內存擴展<b class='flag-5'>CXL</b>加速發展,繁榮AI存儲

    SMART Modular世邁科技CXL內存擴充卡獲CXL聯盟認證

    SMART Modular世邁科技近日宣布其4-DIMM和8-DIMM CXL?(Compute Express Link?)內存擴充卡已成功通過CXL 2.0認證測試,并正式被列入CXL聯盟的整合
    的頭像 發表于 02-05 15:59 ?86次閱讀

    瀾起科技推出PCIe 6.x/CXL 3.x Retimer芯片

    瀾起科技今日宣布推出其最新研發的PCIe 6.x/CXL 3.x Retimer芯片,并已向客戶成功送樣,旨在為人工智能和云計算等應用場景提供性能更卓越的PCIe互連解決方案。這是瀾起科技繼成功推出
    的頭像 發表于 01-22 10:51 ?193次閱讀

    瀾起科技CXL?內存擴展控制器芯片通過CXL 2.0合規性測試

    近日,瀾起科技在CXL(Compute Express Link)技術領域取得了又一重要里程碑。其自主研發的CXL?內存擴展控制器(MXC)芯片成功通過了CXL 2.0合規性測試,并被列入CX
    的頭像 發表于 01-21 14:44 ?245次閱讀

    瀾起科技MXC芯片列入首批CXL 2.0合規供應商清單

    近日,瀾起科技研發的CXL內存擴展控制器(MXC)芯片成功通過了CXL 2.0合規性測試,列入CXL聯盟公布的首批CXL 2.0合規供應商清單。這是繼2023年率先列入
    的頭像 發表于 01-21 10:32 ?153次閱讀
    瀾起科技MXC芯片列入首批<b class='flag-5'>CXL</b> 2.0合規供應商清單

    韓國無晶圓廠初創公司Panmnesia展示第一個支持CXL的AI集群

    在2024?OCP全球峰會上,開發CXL交換機SoC和CXL IP的韓國無晶圓廠初創公司Panmnesia展示了第一個支持CXL的AI集群,該集群采用CXL 3.1交換機。 OCP全球
    的頭像 發表于 11-28 11:04 ?487次閱讀

    研華科技推出SQRAM CXL 2.0 Type 3內存模塊SQR-CX5N

    10月15日最新消息,研華科技(Advantech)于昨日正式揭曉了其最新研發的SQRAM CXL 2.0 Type 3 內存模塊——SQR-CX5N。該模塊遵循EDSFF E3.S 2T標準,擁有
    的頭像 發表于 10-15 15:28 ?506次閱讀

    如何利用CXL協議實現高效能的計算架構

    Using Compute Express Link》(文末附鏈接)。在這篇文章中,Debendra Das Sharma詳盡地闡述了如何利用CXL(Compute Express Link)技術
    的頭像 發表于 09-03 09:14 ?757次閱讀
    如何利用<b class='flag-5'>CXL</b>協議實現高效能的計算架構

    打造異構計算新標桿!國數集聯發布首款CXL混合資源池參考設計

    今日,領先的高速互聯芯片及方案設計廠商國數集聯發布業界首創的CXL混合資源池(Compute Express Link Hybrid Resource Pool ,以下簡稱“CHRP”)參考設計。該
    的頭像 發表于 08-06 14:19 ?380次閱讀
    打造異構計算新標桿!國數集聯發布首款<b class='flag-5'>CXL</b>混合資源池參考設計

    新思科技CXL 3.1驗證解決方案

    機器學習和人工智能日益普及,虛擬機和虛擬組件上的工作負載也隨之不斷增加。為此,行業急需能夠確定工作負載優先次序并保障性能的機制。Compute Express Link(CXL)是處理器與加速器
    的頭像 發表于 08-02 14:43 ?677次閱讀
    新思科技<b class='flag-5'>CXL</b> 3.1驗證解決方案

    國數集聯發布業界首款CXL多級網絡交換機,IB時代的顛覆者

    今日,領先的高速互聯芯片及方案設計廠商國數集聯基于自主研發的CXL ( Compute Express Link )協議 IP,成功研發了業界第一款CXL多級網絡交換機(CXL
    的頭像 發表于 07-31 16:35 ?934次閱讀
    國數集聯發布業界首款<b class='flag-5'>CXL</b>多級網絡交換機,IB時代的顛覆者

    國數集聯研發出首款CXL多級網絡交換機

    今日,全球頂級高速互聯芯片及解決方案設計專家——國數集聯公司,憑借自主研發的CXL(Compute Express Link)協議IP,引領行業前沿,成功研發出全球首款CXL多級網絡交換機(又名CXL Multi-level N
    的頭像 發表于 07-31 13:04 ?695次閱讀

    STM32F407讀取掛在FSMC上的外部ADC數據,開啟DMA的Mem to Mem模式時只能讀取一次FSMC數據,為什么?

    大家好,我現在使用STM32F407,想要讀取掛在FSMC上的外部ADC的數據,我利用NOE產生一個時鐘信號給ADC。 現在的問題是,當我開啟DMA的Mem to Mem 模式時,只能讀取一次
    發表于 05-29 07:20

    三星研發CXL混合存儲模組,實現閃存與CPU數據直傳

    據三星展示的圖片顯示,此模組可以通過CXL接口在閃存部分及CPU之間進行I/O塊傳輸,也可以運用DRAM緩存和CXL接口達到64字節的內存I/O傳輸。
    的頭像 發表于 03-21 14:31 ?925次閱讀

    利用CXL技術重構基于RDMA的內存解耦合

    本文提出了一種基于RDMA和CXL的新型低延遲、高可擴展性的內存解耦合系統Rcmp。其顯著特點是通過CXL提高了基于RDMA系統的性能,并利用RDMA克服了CXL的距離限制。
    發表于 02-29 10:05 ?3592次閱讀
    利用<b class='flag-5'>CXL</b>技術重構基于RDMA的內存解耦合
    百家乐官网视频游戏账号| 百家乐官网赢钱lv| 豪华百家乐官网人桌| 雷州市| 百家乐筹码币套装| 百家乐官网为什么庄5| 豪门百家乐官网的玩法技巧和规则| 波克棋牌完整版下载| 桃源县| 大发888游戏平台黄埔网| 百家乐官网群bet20| 百家乐官网合理的投注法| bet365娱乐平台| 百家乐五铺的缆是什么意思| 豪杰百家乐游戏| 百家乐官网赌博合作| 网络百家乐官网最安全| 百家乐现金平台排名| 百家乐官网排名| 同乐城备用| 大发88817| 全讯网hg055.com| 博彩百家乐最新优惠| 上海百家乐官网的玩法技巧和规则| 百家乐官网电子作弊器| 大发888网页登录帐号| 百合百家乐的玩法技巧和规则| 百家乐官网任你博娱乐场开户注册| 明升百家乐官网娱乐城| 百家乐官网开户博彩论坛| 百家乐官网技巧在那里| 百家乐官网冯式打法| 万源市| 宿松县| 陆丰市| 百家乐波音平台开户导航| 现金百家乐官网攻略| 百家乐官网赚钱项目| 右玉县| 百家乐官网注码方法| 百家乐官网策略与心得|