六合彩今年开了那些特吗,E利博娱乐场官网能赚钱吗,棋牌娱乐城注册送20(中国)·官方网站

Cache對(duì)性能的影響首先我們要知道，CPU訪問(wèn)內(nèi)存時(shí)，不是直接去訪問(wèn)內(nèi)存的，而是先訪問(wèn)緩存（cache）。

當(dāng)緩存中已經(jīng)有了我們要的數(shù)據(jù)時(shí)，CPU就會(huì)直接從緩存中讀數(shù)據(jù)，而不是從內(nèi)存中讀。

CPU和緩存的關(guān)系如下：

緩存分為一級(jí)、二級(jí)、三級(jí)，最靠近CPU的是一級(jí)緩存，最遠(yuǎn)的是內(nèi)存，離CPU越近速度越快。

訪問(wèn)速度上，L1》L2》L3》內(nèi)存，緩存比內(nèi)存速度要快得非常多。

如果CPU操作的數(shù)據(jù)在緩存中，則直接從緩存中讀取，這個(gè)過(guò)程就叫緩存命中。

因此提升性能的關(guān)鍵，就是要提高緩存命中率。下面來(lái)看如何提高緩存命中率。

提高數(shù)據(jù)緩存命中率來(lái)看一個(gè)實(shí)例，有一個(gè)N*N的二維數(shù)組，例如：

int array［N］［N］;

現(xiàn)在用兩個(gè)for循環(huán)遍歷這個(gè)數(shù)組，訪問(wèn)每個(gè)元素的內(nèi)容：

for（i = 0; i 《 N; i+=1） { for（j = 0; j 《 N; j+=1） { array［i］［j］ = 0;//速度快
//array［j］［i］ = 0;//速度慢 } }

有兩種訪問(wèn)方式：array［i］［j］和array［j］［i］。

在性能上，array［i］［j］會(huì)比array［j］［i］執(zhí)行地更快，并且速度相差8倍。

1、速度更快的原因

首先數(shù)組在內(nèi)存上是連續(xù)的，假設(shè)N等于2，則array［2］［2］在內(nèi)存中的排布是：

array［0］［0］、array［0］［1］、array［1］［0］、array［1］［1］、

以array［i］［j］方式訪問(wèn)，即按內(nèi)存中的順序訪問(wèn)，當(dāng)訪問(wèn)array［0］［0］時(shí)，CPU就已經(jīng)把數(shù)組的剩余三個(gè)數(shù)據(jù)（array［0］［1］、array［1］［0］、array［1］［1］）加載到了緩存當(dāng)中。

當(dāng)繼續(xù)訪問(wèn)后三個(gè)元素時(shí)，CPU會(huì)直接從緩存中讀取數(shù)據(jù)，而不需要從內(nèi)存中讀取（cache命中）。因此速度會(huì)很快。

如果以array［j］［i］方式訪問(wèn)數(shù)組，則訪問(wèn)順序?yàn)椋?/p>

array［0］［0］、array［1］［0］、array［0］［1］、array［1］［1］

此時(shí)訪問(wèn)順序是跳躍的，并不是按數(shù)組在內(nèi)存中的的排布順序來(lái)訪問(wèn)。如果N很大的話，那么執(zhí)行array［j］［i］時(shí)，array［j+1］［i］的內(nèi)容是沒法讀進(jìn)緩存里的，等到要訪問(wèn)array［j+1］［i］時(shí)就只能從內(nèi)存中讀取。

所以array［j］［i］的速度會(huì)慢于array［i］［j］。

2、速度相差8倍的原因

剛剛提到，如果這個(gè)二維數(shù)組的N很大，array［j+1］［i］的內(nèi)容是沒法讀到緩存里的，那CPU一次能夠?qū)⒍嗌贁?shù)據(jù)加載進(jìn)緩存里呢？

這個(gè)其實(shí)跟cache line有關(guān)，cache line代表緩存一次載入數(shù)據(jù)的大小。可以通過(guò)以下命令查看cache line為多大：

cat /sys/devices/system/cpu/cpu0/cache/index0/coherency_line_size

cache line為64，代表CPU緩存一次數(shù)據(jù)的大小為64字節(jié)。

當(dāng)訪問(wèn)array［0］［0］時(shí)，該元素所占用的字節(jié)數(shù)不到64字節(jié)，CPU就會(huì)按順序補(bǔ)足后續(xù)元素，就會(huì)把后面的array［0］［1］、array［1］［0］等內(nèi)容一起讀到緩存里，直到湊夠64字節(jié)。

正因如此，按順序訪問(wèn)的array［i］［j］才會(huì)比不按順序訪問(wèn)的array［j］［i］速度快。

再看看為什么速度相差8倍。我們知道，二維數(shù)組中，第一維元素放的是地址，第二維元素才是數(shù)據(jù)。64位系統(tǒng)中，地址占用8個(gè)字節(jié)，cache
line為64的話，地址已經(jīng)占用了8字節(jié)，那每個(gè)cache line最多能載入不到8個(gè)二維數(shù)組元素，N很大的情況下，他們的性能平均下來(lái)就會(huì)相差將近8倍。

結(jié)論：按內(nèi)存布局順序訪問(wèn)，可以提高數(shù)據(jù)緩存命中率。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴