問:為什么 CPU 的浮點運算能力比 GPU 差,為什么不提高 CPU 的浮點運算能力?
「速度區(qū)別主要是來自于架構(gòu)上的區(qū)別」是一個表面化的解釋。對,架構(gòu)是不同。但是這種不同是目前各個廠家選擇的現(xiàn)狀,還是由于本質(zhì)的原因決定的?CPU 能不能增加核?GPU 那張圖為什么不需要 cache?
首先,CPU 能不能像 GPU 那樣去掉 cache?不行。GPU 能去掉 cache 關(guān)鍵在于兩個因素:數(shù)據(jù)的特殊性(高度對齊,pipeline 處理,不符合局部化假設(shè),很少回寫數(shù)據(jù))、高速度的總線。對于后一個問題,CPU 受制于落后的數(shù)據(jù)總線標準,理論上這是可以改觀的。對于前一個問題,從理論上就很難解決。因為 CPU 要提供通用性,就不能限制處理數(shù)據(jù)的種類。這也是 GPGPU 永遠無法取代 CPU 的原因。
其次,CPU 能不能增加很多核?不行。首先 cache 占掉了面積。其次,CPU 為了維護 cache 的一致性,要增加每個核的復(fù)雜度。還有,為了更好的利用 cache 和處理非對齊以及需要大量回寫的數(shù)據(jù),CPU 需要復(fù)雜的優(yōu)化(分支預(yù)測、out-of-order 執(zhí)行、以及部分模擬 GPU 的 vectorization 指令和長流水線)。所以一個 CPU 核的復(fù)雜度要比 GPU 高的多,進而成本就更高(并不是說蝕刻的成本高,而是復(fù)雜度降低了成片率,所以最終成本會高)。所以 CPU 不能像 GPU 那樣增加核。
至于控制能力,GPU 的現(xiàn)狀是差于 CPU,但是并不是本質(zhì)問題。而像遞歸這樣的控制,并不適合高度對齊和 pipeline 處理的數(shù)據(jù),本質(zhì)上還是數(shù)據(jù)問題。
-
cpu
+關(guān)注
關(guān)注
68文章
10904瀏覽量
213020 -
gpu
+關(guān)注
關(guān)注
28文章
4775瀏覽量
129357
原文標題:為什么 CPU 的浮點運算能力比 GPU 差,為什么不提高 CPU 的浮點運算能力?
文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
【RA-Eco-RA4E2-64PIN-V1.0開發(fā)板試用】RA4E2的DSP浮點性能的軟件浮點測試和硬件浮點測試對比
FPGA中的浮點四則運算是什么
![FPGA中的<b class='flag-5'>浮點</b>四則<b class='flag-5'>運算</b>是什么](https://file1.elecfans.com/web2/M00/0B/C2/wKgZomc4D8yACyL2AAAWwvTkxeE056.jpg)
FPGA中浮點四則運算的實現(xiàn)過程
![FPGA中<b class='flag-5'>浮點</b>四則<b class='flag-5'>運算</b>的實現(xiàn)過程](https://file1.elecfans.com/web2/M00/0B/C2/wKgZomc4D8yACyL2AAAWwvTkxeE056.jpg)
【RA-Eco-RA2E1-48PIN-V1.0開發(fā)板試用】在M23內(nèi)核上使用qfplib浮點運算庫進行浮點運算
【AG32開發(fā)板免費試用】+數(shù)據(jù)采集存儲系統(tǒng)(2)-串口輸出+浮點運算驗證
雙核cpu和單核cpu的區(qū)別
請問AURIX TC3xx tricore架構(gòu)下浮點運算和將浮點數(shù)小數(shù)點去掉變成整數(shù)來計算哪種方式更加節(jié)省算力?
cpu的運算器和控制器的作用是什么
cpu控制器負責什么運算
cpu控制器和運算器組成的部件有哪些
在定時器內(nèi)使用浮點運算的PID控制算法,程序就會重啟,為什么?
優(yōu)秀的Verilog/FPGA開源項目-浮點運算器(FPU)介紹
![優(yōu)秀的Verilog/FPGA開源項目-<b class='flag-5'>浮點</b><b class='flag-5'>運算</b>器(FPU)介紹](https://file1.elecfans.com/web2/M00/DA/FB/wKgZomYrH4yASZLlAAAfzlUnCNg147.png)
評論