那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于英特爾 Skylake 臺式機處理器設計的單核

lhl545545 ? 來源:與非網 ? 作者:與非網 ? 2020-09-02 11:36 ? 次閱讀

從廉價筆記本電腦到價值一百萬美元的服務器,任何一臺計算機中CPU都有一個叫做“緩存”的東西。當然緩存的級別往往有所不同。

緩存很重要,不然也不會無處不在。但是緩存到底有什么作用,為什么是不同級別的呢?

而且 12 路路組相連到底意味著什么?

緩存到底是什么?

TL 和 DR 很小,但卻非??觳⑽挥贑PU的邏輯單元旁邊。當然,我們需要了解更多有關緩存的信息

讓我們從一個虛構的,神奇的存儲系統開始說起。這個存儲系統速度極快,可以一次處理無限的數據,并始終保持數據安全。對它來說甚至不存在任何需要遠程操作的東西,但是如果的確存在,處理器的設計將更加簡單。CPU僅需要具有用于加法,乘法等的邏輯單元,以及用于處理數據傳輸的系統。這是因為我們的理論存儲系統可以立即發送和接收所需的所有編號;沒有一個邏輯單元會等待數據處理。

但是,眾所周知,實際上不存在任何上述魔術般的存儲技術。反之,我們擁有硬盤驅動器或固態驅動器,即使其中最好的驅動器也無法遠程處理典型 CPU 所需的所有數據傳輸。原因在于,現代 CPU 的運行速度非常快 - 它們僅需一個時鐘周期即可將兩個 64 位整數值相加,而對于以 4 GHz 運行的 CPU,則僅為 0.00000000025 秒或四分之一納秒。同時,旋轉硬盤驅動器僅需數千納秒即可在內部磁盤上查找數據,更不用說傳輸數據了,而固態驅動器仍需數十或數百納秒。

顯然,此類驅動器無法內置在處理器中,因此這意味著兩者之間將存在物理隔離。這只會增加數據移動的時間,使情況變得更糟。因此,我們需要的是另一個數據存儲系統,它位于處理器和主存儲之間。它需要比驅動器更快的速度,能夠同時處理大量數據傳輸,并且離處理器更近一些。

如今它已成為現實,叫做RAM。每個計算機系統都有一些用于上述目的的裝置。而幾乎所有這類存儲都是 DRAM(動態隨機存取存儲器),它能夠比任何驅動器更快地傳輸數據。但是,盡管 DRAM速度極快,但它無法存儲盡可能多的數據。

美光公司是 DRAM 的少數制造商之一,其中一些最大的 DDR4 存儲器芯片可容納 32 Gbit 或 4 GB 數據。最大的硬盤驅動器的容量是此容量的 4000 倍。因此,盡管我們提高了數據網絡的速度,但仍需要附加系統(硬件和軟件),以便確定應將哪些數據保留在有限數量的 DRAM 中,以備 CPU 使用。或者至少可以將 DRAM 置于芯片封裝中(稱為嵌入式 DRAM)。不過,CPU 很小,所以您不能在其中塞太多。

絕大多數 DRAM 位于處理器旁邊(插入主板)。在計算機系統中,它始終是最接近 CPU 的組件。然而,這還是不夠快。DRAM 仍需要約 100 納秒的時間才能找到數據,但至少每秒可以傳輸數十億比特。看來我們需要另一級存儲器,才能進入處理器單元和 DRAM 之間。

左級輸入:SRAM(靜態隨機存取存儲器)。在 DRAM 使用微觀電容器以電荷形式存儲數據的情況下,SRAM 使用晶體管做同樣的事情,并且它們的工作速度幾乎與處理器中的邏輯單元一樣快(大約比 DRAM 快 10 倍)。

當然,SRAM 有一個缺點,那就是空間。

基于晶體管的內存比 DRAM 占用更多的空間:對于相同大小的 4 GB DDR4 芯片,您將獲得不到 100 MB 的 SRAM。但是,由于它是通過與創建 CPU 相同的過程制成的,因此 SRAM 可以直接在處理器內部構建,并盡可能靠近邏輯單元。每增加一個環節,我們就增加了數據移動的速度,從而增加了存儲量。我們可以繼續添加更多的環節,每個環節更快但簡潔。

因此,我們對高速緩存下了一個更為專業的定義:它是全部位于處理器內部的多個 SRAM 塊,通過以超快的速度發送和存儲數據來確保邏輯單元保持盡可能繁忙。

對這個定義滿意嗎?很好 - 因為從現在開始它將變得更加復雜!

高速緩存:多層停車場

如上所述,需要緩存是因為沒有一種神奇的存儲系統可以滿足處理器中邏輯單元的數據需求。現代的 CPU 和圖形處理器包含許多 SRAM 塊,這些 SRAM 塊在內部組織成一個層次結構,即一系列高速緩存,其順序如下:

在上圖中,CPU 由黑色虛線矩形表示。ALU(算術邏輯單元)在最左邊;這些是為處理器提供動力,處理芯片運算能力的結構。從專業角度來講,它不是緩存,而最接近 ALU 的內存級別是寄存器(它們組合在一起成為一個寄存器文件)。

其中的每一個都擁有一個數字,例如 64 位整數。該值本身可能是有關某物的一條數據,一條特定指令的代碼或某些其他數據的內存地址。

臺式機 CPU 中的寄存器文件非常小 - 例如,在 Intel 的 Core i9-9900K 中,每個內核中有兩個存儲區,而一個整數存儲區僅包含 180 個 64 位寄存器。另一個寄存器文件,用于向量(數字的小數組),具有 168 個 256 位條目。因此,每個內核的總寄存器文件略低于 7 kB。相比之下,Nvidia GeForce RTX 2080 Ti 的流式多處理器(GPU 等效于 CPU 內核)中的寄存器文件大小為 256 kB。

寄存器是 SRAM,就像高速緩存一樣,但是它們和它們所服務的 ALU 一樣快,可以在一個時鐘周期內輸入和輸出數據。但是它們的設計并不是要容納太多數據(僅存儲其中的一部分),這就是為什么附近總是存在一些更大的內存塊的原因:這是 1 級緩存。

可以在最左側看到 ALU 和寄存器文件(以綠色突出顯示)。圖片的頂部中間是白色的 1 級數據緩存。它容納的信息并不多,僅為 32 kB,但是與寄存器一樣,它非常靠近邏輯單元,并以與它們相同的速度運行。

另一個白色矩形表示 1 級指令高速緩存,大小也為 32 kB。顧名思義,該命令存儲了各種命令,這些命令可以分解成較小的所謂的微操作(通常標記為μop),以供 ALU 執行。它們也有一個緩存,您可以將其歸類為 0 級,因為它比 L1 緩存小(僅進行 1,500 次操作)并且更近。

您可能想知道為什么這些 SRAM 塊這么小?為什么它們不是一兆字節大小?數據和指令高速緩存一起占用的芯片空間幾乎與主要邏輯單元占用的空間相同,因此使其增大將增加芯片的整體尺寸。

但是它們僅保留幾 kB 的主要原因是,隨著內存容量的增大,查找和檢索數據所需的時間也會增加。L1 高速緩存必須達到真正意義上的快,因此必須在大小和速度之間達成折衷 - 最多需要大約 5 個時鐘周期(較長的浮點值)才能從該高速緩存中獲取數據,以備使用。

但是,如果這是處理器內部唯一的緩存,則其性能將突然崩潰。這就是為什么它們都在內核中內置了另一級內存的原因:二級緩存。這是一個通用的存儲塊,保存著指令和數據。

它總是比級別 1 大很多:AMD Zen 2 處理器的最大容量為 512 kB,因此可以保持較低級別的緩存的良好供應。但是,這種額外的大小需要付出一定的代價,而與 1 級相比,從此緩存中查找和傳輸數據大約要花費兩倍的時間。

追溯到最初的 Intel Pentium 時代,Level 2 高速緩存是一個單獨的芯片,其位于小型插入式電路板上(例如RAMDIMM)或內置在主板中。最終它像奔騰 III 和 AMD K6-III 處理器一樣,一直運用于 CPU 封裝本身,直到最終被集成到 CPU 裸片中。

由于多核芯片的興起,這項發展很快之后又有了另一個級別的緩存,以支持其他較低的級別。

上圖是 Intel Kaby Lake 芯片,其左中間有 4 個內核(集成 GPU 占據了右側一半的裸片)。每個內核都有其自己的“專用”組 1 級和 2 級緩存(白色和黃色高亮顯示),但它們也帶有第三組 SRAM 塊。

3 級高速緩存即使直接圍繞一個內核也可以與其他內核完全共享 - 每個都可以自由訪問另一個 L3 高速緩存的內容。它 內存更大(在 2 到 32 MB 之間),但也慢得多,平均超過 30 個周期(尤其是在內核需要使用相距一定距離的緩存塊中的數據時)。

在下面,我們可以看到 AMD Zen 2 架構中的單核:白色的 32 kB 1 級數據和指令緩存,黃色的 512 KB 2 級緩存和紅色的 4 MB 巨大塊 L3 緩存。

不只是一個數字:

高速緩存兩個環節:其一是來提高性能通過加速向邏輯單元的數據傳輸,其二是保留常用指令和數據的副本。緩存中存儲的信息分為兩部分:數據本身以及它最初位于系統內存 / 存儲中的位置。此地址稱為緩存標簽。

當 CPU 運行要從內存讀取數據或向內存寫入數據的操作時,它首先檢查 1 級緩存中的變量。如果存在所需的數據(緩存命中),則幾乎可以立即訪問該數據。當所需標簽不在最低緩存級別中時,即緩存未命中。

因此,在 L1 高速緩存中會有一個新標簽,其余的處理器體系結構將接管,盡數瀏覽其他高速緩存級別(如有必要,一直返回主存儲驅動器)以查找該標簽的數據。但是要在 L1 緩存中為該新標簽騰出空間,必須將其他內容始終引導到 L2 中。

這導致了幾乎恒定的數據改組,所有這些都只需要幾個時鐘周期即可實現。實現此目的的唯一方法是在 SRAM 周圍構建一個復雜的結構,以處理數據管理。換句話說,如果一個 CPU 內核僅由一個 ALU 組成,則 L1 緩存會簡單得多,但是由于 ALU 有數十個(其中許多將處理兩個指令線程),因此緩存需要多個連接來保持一切都在進行中。

您可以使用免費程序(例如 CPU-Z)來檢查為自己的計算機供電的處理器的緩存信息。但是所有這些信息意味著什么?一個重要的元素是關聯的標簽集。這與規則有關,這些規則取決于由系統內存中的數據塊復制到緩存的方式。

上面的緩存信息適用于 Intel Core i7-9700K。它的 1 級高速緩存每個都分成 64 個小塊,稱為集合,并且每個小塊進一步劃分為高速緩存行(大小為 64 字節)。集相關意味著將來自系統內存的數據塊映射到一個特定集合中的高速緩存行上,而不是自由地在任何地方進行映射。

8 向告訴我們,一個塊可以與一組中的 8 條緩存行關聯。關聯性級別越高(即“方式”越多),則當 CPU 搜尋數據時,命中高速緩存的機會就越大,并且減少由高速緩存未命中引起的損失。缺點是它增加了復雜性,增加了功耗,還可能降低性能,因為有更多的緩存行要處理一個數據塊。

高速緩存復雜性的另一方面在于如何在各個級別上保留數據。規則是在包含策略中設置的。例如,英特爾酷睿處理器具有完全包含的 L1 + L3 緩存。例如,這意味著第 1 級中的相同數據也可以在第 3 級中。這似乎在浪費寶貴的緩存空間,但是好處是,如果處理器在搜索低級標簽時出錯,數據就會丟失,而不需要遍歷更高的級別來找到它。

在同一處理器中,L2 緩存是非包含性的:存儲在其中的任何數據都不會復制到任何其他級別。這樣可以節省空間,但確實會導致芯片的存儲系統必須搜索 L3 以找到丟失的標簽(實際上總會比這個更大一些)。受害者緩存與此類似,但是它們習慣于存儲從較低級別推出的信息 - 例如,AMD 的 Zen 2 處理器使用 L3 受害者緩存,該緩存僅存儲來自 L2 的數據。

還有其他用于緩存的策略,例如何時將數據寫入緩存和主系統內存。這些稱為寫策略,當今大多數 CPU 使用回寫式緩存。這意味著,當將數據寫入高速緩存級別時,在使用其副本更新系統內存之前會有一個延遲。在大多數情況下,只要數據保留在高速緩存中,此暫停就會一直運行。只有將其引導后,RAM 才會獲取信息。

對于處理器設計者而言,選擇高速緩存的數量,類型和策略都是為了平衡對更大處理器能力的需求與增加的復雜性和所需的芯片空間。如果有可能擁有 20 MB,1000 路完全關聯的 1 級高速緩存,而芯片又不大的離譜(并消耗相同的功率),那么我們都將擁有配備這種芯片的計算機!

在過去的十年中,當今 CPU 中最低的緩存級別并沒有太大變化。但是,級別 3 緩存的大小仍在繼續增長。十年前,如果您幸運地擁有一臺售價 999 美元的 Intel i7-980X,則可以獲得 12 MB 的內存。如今,您只需花一半的錢就能得到 64 MB。

簡而言之,緩存是不可或缺的,也是尖端技術的體現之一。我們沒有研究過 CPU 和 GPU 中的其他緩存類型(例如轉換查找緩沖區或紋理緩存),但是由于它們都遵循我們在此介紹的簡單的級別結構和模式,因此聽起來可能并不復雜。
責任編輯:pj

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    19407

    瀏覽量

    231182
  • 驅動器
    +關注

    關注

    53

    文章

    8271

    瀏覽量

    147060
  • 晶體管
    +關注

    關注

    77

    文章

    9745

    瀏覽量

    138896
收藏 人收藏

    評論

    相關推薦

    英特爾發布新一代Core Ultra芯片,為2025移動計算確立新標準

    適用于需要強大獨立 GPU 的移動游戲玩家的 Core Ultra 200HX 芯片 。同時,英特爾展示了酷睿Ultra 200V系列處理器和酷睿Ultra 200S系列臺式機處理器。
    的頭像 發表于 01-14 00:58 ?2115次閱讀
    <b class='flag-5'>英特爾</b>發布新一代Core Ultra芯片,為2025移動計算確立新標準

    英特爾發布酷睿Ultra 200S系列臺式機處理器

    近日,英特爾正式推出了酷睿Ultra 200S系列處理器家族,為臺式機平臺帶來了全新的AI PC功能。此次發布的處理器家族涵蓋了5款未鎖頻的臺式機
    的頭像 發表于 10-11 17:36 ?561次閱讀

    英特爾發布至強6處理器產品

    以“綠色向新,釋放新質生產力”為主題的英特爾至強6能效核處理器新品發布會在北京舉行。會上,英特爾重磅推出首款配備能效核的英特爾至強6處理器
    的頭像 發表于 09-23 15:48 ?420次閱讀

    選擇英特爾? 酷睿? 處理器家族,開啟智能計算新時代

    在數字化轉型加速的時代,計算性能的提升已成為每個用戶的核心訴求。無論是職場精英、游戲玩家、內容創作者,還是家庭娛樂愛好者, 英特爾? 酷睿? 處理器家族 憑借卓越的性能與智能優化技術,為用戶帶來高效
    發表于 09-18 10:39 ?8849次閱讀
    選擇<b class='flag-5'>英特爾</b>? 酷睿? <b class='flag-5'>處理器</b>家族,開啟智能計算新時代

    英特爾酷睿Ultra處理器出貨量預計飆升

    英特爾中國區董事長王銳近日透露,英特爾酷睿Ultra處理器自問世以來,已經在全球范圍內取得了顯著的成績。據王銳介紹,截至目前,已有超過800萬臺設備搭載了這款高性能處理器,這充分證明了
    的頭像 發表于 06-20 09:23 ?819次閱讀

    英特爾首款至強6處理器上市

    在北京這座古都的現代舞臺上,英特爾?舉行了一場別開生面的新品發布會,主題為“綠色向新,釋放新質生產力”。此次盛會聚焦在英特爾至強? 6能效核處理器上,這一劃時代的產品不僅代表著英特爾
    的頭像 發表于 06-11 09:51 ?625次閱讀

    英特爾CEO:AI時代英特爾動力不減

    英特爾CEO帕特·基辛格堅信,在AI技術的飛速發展之下,英特爾處理器仍能保持其核心地位。基辛格公開表示,摩爾定律仍然有效,而英特爾處理器
    的頭像 發表于 06-06 10:04 ?490次閱讀

    已有超過500款AI模型在英特爾酷睿Ultra處理器上得以優化運行

    近日,英特爾宣布在全新英特爾 酷睿 Ultra處理器上,有超過500款AI模型得以優化運行。
    的頭像 發表于 05-11 09:31 ?807次閱讀

    英特爾酷睿Ultra處理器突破500個AI模型優化

    英特爾在最新推出的英特爾? 酷睿? Ultra處理器上宣布,超過500款AI模型已得到優化運行。這款處理器無疑是市場上領先的AI PC處理器
    的頭像 發表于 05-09 11:18 ?829次閱讀

    英特爾二季度對酷睿Ultra處理器供應受限

    英特爾首席執行官帕特·基辛格在最新的財報電話會議上透露,受晶圓級封裝產能限制,二季度酷睿Ultra處理器的供應將面臨挑戰。隨著AI PC需求的激增和Windows更新周期的推動,客戶對英特爾
    的頭像 發表于 05-06 11:04 ?718次閱讀

    聯想將推MODT平臺臺式機,搭載英特爾酷睿HX55處理器

     聯想中國臺式規劃經理 @WolStame 透露,將發布搭載英特爾酷睿 HX55 筆記本處理器的 MoDT (Mobile on DeskTop) 平臺臺式整機產品,這不是小型主機。新
    的頭像 發表于 04-29 16:53 ?1375次閱讀

    英特爾酷睿第14代處理器i9-14900KS正式發布

    近日,英特爾再次引領行業潮流,發布了備受矚目的英特爾?酷睿?第14代處理器i9-14900KS的完整規格和上市信息。這款臺式機處理器無疑為眾
    的頭像 發表于 03-16 09:29 ?1308次閱讀

    蘋果M3芯片相當于英特爾什么處理器

    蘋果M3芯片在性能上相當于英特爾的頂級處理器,具有出色的計算能力和高效的功耗控制。與英特爾的頂級芯片相比,M3芯片在多個方面都表現出色,特別是在處理復雜任務和運行大型應用時,其性能優勢
    的頭像 發表于 03-13 16:36 ?1.7w次閱讀

    英特爾推出新款酷睿 Ultra和第14代處理器,助力企業升級vPro平臺

    英特爾在此次大會上宣布,將攜手眾多廠商如宏碁、華碩、戴爾、Dynabook、富士通、惠普、聯想、LG、微軟Surface、NEC、松下、三星和VAIO,共同推出超過百款基于英特爾最先進芯片的商用筆記本電腦、臺式機、一體
    的頭像 發表于 02-28 10:16 ?811次閱讀

    英特爾至強處理器優化升級,助力打造未來高能效數據中心

    英特爾最新發布的第五代至強可擴展處理器,擁有多達64個核心,性能提升高達1.4倍。 英特爾于去年12月正式推出了擁有多達64個核心的第五代至強可擴展處理器,其性能相較于上一代產品提升高
    的頭像 發表于 02-26 17:39 ?809次閱讀
    澳门百家乐鸿福厅| 百家乐出老千视频| 大发888体育在线投注平台| 百家乐官网路子分析| 百家乐官网发牌规| 威尼斯人娱乐场开户| 百家乐官网园搏彩论坛| 百家乐最好的玩法| 澳门博彩娱乐有限公司| 月亮城百家乐官网的玩法技巧和规则| 芝加哥百家乐的玩法技巧和规则 | 德州扑克外挂| 百家乐官网永利娱乐平台| 贝博百家乐的玩法技巧和规则 | 申请百家乐官网会员送彩金| 百家乐千术手法| 百家乐官网补牌规制| 百家乐在线投注系统| 足球即时比分网| 马德里百家乐官网的玩法技巧和规则| 大发888平台啥时候最赢钱| 真人百家乐官网视频赌博| 362百家乐的玩法技巧和规则| 在线百家乐官网怎么下注| 网络百家乐的玩法技巧和规则 | 百家乐官网如何盈利| 大发888真钱娱乐游戏| 百家乐官网技巧打| 大发888娱乐城官网下载| 百家乐官网网上真钱娱乐| 大发888娱乐城 df888ylc3403| 网上百家乐官网网| 德州扑克专业版| 太阳城百家乐网上| 蒙特卡罗娱乐场| 澳门百家乐娱乐城开户| 百家乐官网赢利策略| 百家乐官网7scs| 百家乐官网庄和闲的赌法| 澳门百家乐先赢后输| 澳门百家乐官网走势图|