複製鏈接
請複製以下鏈接發送給好友

二級緩存容量

鎖定
所謂處理器緩存,通常指的是二級高速緩存,或外部高速緩存。即高速緩衝存儲器,是位於CPU和主存儲器DRAM(Dynamic RAM)之間的規模較小的但速度很高的存儲器,通常由SRAM(靜態隨機存儲器)組成。
中文名
二級緩存容量
所屬學科
計算機科學
稱    呼
處理器緩存
設計思想
用少量的SRAM

二級緩存容量基本介

二級緩存容量緩存定義

CPU緩存(Cache Memory)位於CPU與內存之間的臨時存儲器,它的容量比內存小但交換速度快。在緩存中的數據是內存中的一小部分,但這一小部分是短時間內CPU即將訪問的,當CPU調用大量數據時,就可避開內存直接從緩存中調用,從而加快讀取速度。由此可見,在CPU中加入緩存是一種高效的解決方案,這樣整個內存儲器(緩存+內存)就變成了既有緩存的高速度,又有內存的大容量的存儲系統了。緩存對CPU的性能影響很大,主要是因為CPU的數據交換順序和CPU與緩存間的帶寬引起的。

二級緩存容量設計思想

處理器緩存的基本思想是用少量的SRAM作為CPU與DRAM存儲系統之間的緩衝區,即Cache系統。80486以及更高檔微處理器的一個顯著特點是處理器芯片內集成了SRAM作為Cache,由於這些Cache裝在芯片內,因此稱為片內Cache。486芯片內Cache的容量通常為8K。高檔芯片如Pentium為16KB,Power PC可達32KB。Pentium微處理器進一步改進片內Cache,採用數據和雙通道Cache技術,相對而言,片內Cache的容量不大,但是非常靈活、方便,極大地提高了微處理器的性能。片內Cache也稱為一級Cache。由於486,586等高檔處理器的時鐘頻率很高,一旦出現一級Cache未命中的情況,性能將明顯惡化。在這種情況下采用的辦法是在處理器芯片之外再加Cache,稱為二級Cache。二級Cache實際上是CPU和主存之間的真正緩衝。由於系統板上的響應時間遠低於CPU的速度,如果沒有二級Cache就不可能達到486,586等高檔處理器的理想速度。二級Cache的容量通常應比一級Cache大一個數量級以上。在系統設置中,常要求用户確定二級Cache是否安裝及尺寸大小等。二級Cache的大小一般為128KB、256KB或512KB。在486以上檔次的微機中,普遍採用256KB或512KB同步Cache。所謂同步是指Cache和CPU採用了相同的時鐘週期,以相同的速度同步工作。相對於異步Cache,性能可提高30%以上。

二級緩存容量工作原理

緩存的工作原理是當CPU要讀取一個數據時,首先從緩存中查找,如果找到就立即讀取並送給CPU處理;如果沒有找到,就用相對慢的速度從內存中讀取並送給CPU處理,同時把這個數據所在的數據塊調入緩存中,可以使得以後對整塊數據的讀取都從緩存中進行,不必再調用內存。
正是這樣的讀取機制使CPU讀取緩存的命中率非常高(大多數CPU可達90%左右),也就是説CPU下一次要讀取的數據90%都在緩存中,只有大約10%需要從內存讀取。這大大節省了CPU直接讀取內存的時間,也使CPU讀取數據時基本無需等待。總的來説,CPU讀取數據的順序是先緩存後內存。

二級緩存容量緩存發展

最早先的CPU緩存是個整體的,而且容量很低,英特爾公司從Pentium時代開始把緩存進行了分類。當時集成在CPU內核中的緩存已不足以滿足CPU的需求,而製造工藝上的限制又不能大幅度提高緩存的容量。因此出現了集成在與CPU同一塊電路板上或主板上的緩存,此時就把 CPU內核集成的緩存稱為一級緩存,而外部的稱為二級緩存。一級緩存中還分數據緩存(Data Cache,D-Cache)和指令緩存(Instruction Cache,I-Cache)。二者分別用來存放數據和執行這些數據的指令,而且兩者可以同時被CPU訪問,減少了爭用Cache所造成的衝突,提高了處理器效能。英特爾公司在推出Pentium 4處理器時,用新增的一種一級追蹤緩存替代指令緩存,容量為12KμOps,表示能存儲12K條微指令
隨着CPU製造工藝的發展,二級緩存也能輕易的集成在CPU內核中,容量也在逐年提升。再用集成在CPU內部與否來定義一、二級緩存,已不確切。而且隨着二級緩存被集成入CPU內核中,以往二級緩存與CPU大差距分頻的情況也被改變,此時其以相同於主頻的速度工作,可以為CPU提供更高的傳輸速度。

二級緩存容量作用

二級緩存是CPU性能表現的關鍵之一,在CPU核心不變化的情況下,增加二級緩存容量能使性能大幅度提高。而同一核心的CPU高低端之分往往也是在二級緩存上有差異,由此可見二級緩存對於CPU的重要性。
CPU在緩存中找到有用的數據被稱為命中,當緩存中沒有CPU所需的數據時(這時稱為未命中),CPU才訪問內存。從理論上講,在一顆擁有二級緩存的CPU中,讀取一級緩存的命中率為80%。也就是説CPU一級緩存中找到的有用數據佔數據總量的80%,剩下的20%從二級緩存中讀取。由於不能準確預測將要執行的數據,讀取二級緩存的命中率也在80%左右(從二級緩存讀到有用的數據佔總數據的16%)。那麼還有的數據就不得不從內存調用,但這已經是一個相當小的比例了。較高端的CPU中,還會帶有三級緩存,它是為讀取二級緩存後未命中的數據設計的—種緩存,在擁有三級緩存的CPU中,只有約5%的數據需要從內存中調用,這進一步提高了CPU的效率。

二級緩存容量緩存算法

為了保證CPU訪問時有較高的命中率,緩存中的內容應該按一定的算法替換。一種較常用的算法是“最近最少使用算法”(LRU算法),它是將最近的一段時間內最少被訪問過的行淘汰出局。因此需要為每行設置一個計數器,LRU算法是把命中行的計數器清零,其他各行計數器加1。當需要替換時淘汰行計數器計數值最大的數據行出局。這是一種高效、科學的算法,其計數器清零過程可以把一些頻繁調用後再不需要的數據淘汰出緩存,提高緩存的利用率。

二級緩存容量緩存容量

CPU儘可能地讓用過的指令放在手邊,當CPU需要指令的時候,它首先在它的一級緩存中查找,一級緩存就是存放用過的指令的地方。在PIII或賽揚II中,一級緩存的大小為32K,與CPU同速。如果CPU在一級緩存中找不到它所需的指令,就發生通常稱為緩存遺漏(cache miss)的現象。 當CPU在一級緩存中發現緩存遺漏的時候,就會轉到二級緩存中查找所需的指令。PIII的二級緩存大小為256K,與CPU核心速度相同,賽揚II中的二級緩存大小為128K。當二級緩存中出現緩存遺漏時,計算機就轉向系統內存。系統內存的頻率一般為100MHz,PC133的速度是133MHz。 在果在這些地方都找不到所需指令,計算機就只好向硬盤提出讀取請求了。如果所需指令連硬盤上都找不到,就只好説明你根本沒有操作系統,也就是説系統根本不能運行了。在這裏,硬盤是計算機中最慢的部分了。更多更快的內存,就是為了把所需指令全都放在一、二級緩存和系統內存中。這樣,當計算機向硬盤請求指令的時候,一次可以獲得許多,性能大大提高。這同時也避免了反覆讀取硬盤,造成硬盤負荷沉重。

二級緩存容量重要作用

二級緩存容量性能影響

現代桌面級PC的CPU二級緩存容量大多數在64KB到2MB之間。因為CPU二級緩存容量對CPU性能有不小的影響,所以低端CPU和中高端CPU在物理結構上的差異主要就是二級緩存容量的大小。那麼二級緩存容量為什麼如此重要?它對CPU性能有什麼樣的影響呢?
CPU二級緩存作為一級緩存的“後備倉庫”,用於為一級緩存存儲更多的數據,減少CPU直接訪問內存 的次數。理論上,CPU訪問並調用緩存的數據所佔的比重越大,則CPU訪問並調用內存的數據所佔的比重就越小,那麼因訪問內存而耽誤的時間 就越少。所以緩存的容量越大,CPU的實際效率也就越高,性能就越強。

二級緩存容量邏輯差異

實際上,Intel和AMD處理器一級緩存邏輯結構設計上有所不同,所以二級緩存對CPU性能的影響也不盡相同。因為CPU讀取的 數據(包括指令)中有80%的數據來自一級緩存,所以一級緩存邏輯結構決定了CPU二級緩存容量對CPU性能的影響。Intel的Pentium 4及Celeron系列處理器的一級數據緩存被稱為“數據代碼指令追蹤(讀寫)緩存”;AMD的Athlon 64/Athlon XP/Sempron/Duron系列處理器 的一級數據緩存叫作“實數據讀寫緩存”。
但是在“數據代碼指令追蹤緩存”架構的CPU中,一級數據緩存並不存儲這些最先用到的數據(“1、2……449、450”),而是將這些數據存儲到二級緩存中,一級數據緩存僅僅存儲這些數據在二級緩存中的起止地址(又稱為:指令代碼)。例如,數據“1、2……449、450” 順序存儲在二級緩存中,數據“1”所在地址為“00001F”,數據“450” 所在地址為“00451F”,實際上一級數據緩存只需要存儲“00001F”和“00451F”這兩個地址就可以了,而不需要存儲大量的數據。

二級緩存容量分類

二級緩存容量AMD

Athlon 64 X2 CPU的核心主要有Manchester和Toledo兩種,他們的二級緩存都是CPU內部兩個內核具有互相獨立的二級緩存,其中,Manchester核心為每核心512KB,而Toledo核心為每核心1MB。處理器內部的兩個內核之間的緩存數據同步是依靠CPU內置的System Request Interface(系統請求接口,SRI)控制,傳輸在CPU內部即可實現。這樣一來,不但CPU資源佔用很小,而且不必佔用內存總線資源,數據延遲也比Intel的Smithfield核心和Presler核心大為減少,協作效率明顯勝過這兩種核心。不過,由於這種方式仍然是兩個內核的緩存相互獨立,從架構上來看也明顯不如以Yonah核心為代表的Intel的共享緩存技術Smart Cache。

二級緩存容量Intel

Intel的雙核心CPU主要有Pentium D、Pentium EE、Core Duo三種,其中Pentium D、Pentium EE的二級緩存方式完全相同。Pentium D和Pentium EE的二級緩存都是CPU內部兩個內核具有互相獨立的二級緩存,其中,8xx系列的Smithfield核心CPU為每核心1MB,而9xx系列的Presler核心CPU為每核心2MB。這種CPU內部的兩個內核之間的緩存數據同步是依靠位於主板北橋芯片上的仲裁單元通過前端總線在兩個核心之間傳輸來實現的,所以其數據延遲問題比較嚴重,性能並不盡如人意。
Core Duo使用的核心為Yonah,它的二級緩存則是兩個核心共享2MB的二級緩存,共享式的二級緩存配合Intel的“Smart cache”共享緩存技術,實現了真正意義上的緩存數據同步,大幅度降低了數據延遲,減少了對前端總線的佔用,性能表現不錯,是雙核心處理器上最先進的二級緩存架構。今後Intel的雙核心處理器的二級緩存都會採用這種兩個內核共享二級緩存的“Smart cache”共享緩存技術。

二級緩存容量重要意義

二級緩存容量工作原則

緩存工作的原則,就是“引用的局部性”,這可以分為時間局部性和空間局部性。空間局部性是指CPU在某一時刻需要某個數據,那麼很可能下一步就需要其附近的數據;時間局部性是指當某個數據被訪問過一次之後,過不了多久時間就會被再一次訪問。對於應用程序而言,不管是指令流還是數據流都會出現引用的局部性現象。
舉個簡單的例子,比如在播放DVD影片的時候,DVD數據由一系列字節組成,這個時候CPU會依次從頭處理到尾地調用DVD數據,如果CPU這次讀取DVD數據為1分30秒,那麼下次讀取的時候就會從1分31秒開始,因此這種情況下有序排列的數據都是依次被讀入CPU進行處理。從數據上來看,對於Word一類的應用程序通常都有着較好的空間局部性。用户在使用中不會一次打開7、8個文檔,不諱在其中某一個文檔中打上幾個詞就換一個。大多數用户都是打開一兩個文檔,然後就是長時間對它們進行處理而不會做其他事情。這樣在內存中的數據都會集中在一個區域中,也就可以被CPU集中處理。

二級緩存容量代碼設計

從程序代碼上來考慮,設計者通常也會盡量避免出現程序的跳躍和分支,讓CPU可以不中斷地處理大塊連續數據。遊戲、模擬和多媒體處理程序通常都是這方面的代表,以小段代碼連續處理大塊數據。不過在辦公運用程序中,情況就不一樣了。改動字體,改變格式,保存文檔,都需要程序代碼不同部分起作用,而用到的指令通常都不會在一個連續的區域中。於是CPU就不得不在內存中不斷跳來跳去尋找需要的代碼。這也就意味着對於辦公程序而言,需要較大的緩存來讀入大多數經常使用的代碼,把它們放在一個連續的區域中。如果緩存不夠,就需要緩存中的數據,而如果緩存足夠大的話,所有的代碼都可以放入,也就可以獲得最高的效率。同理,高端的數據應用以及遊戲應用則需要更高容量的緩存。

二級緩存容量製作工藝

二級緩存很重要,簡單的理解就是:二級緩存(即L2)的大小是衡量CPU性能的一個重要指標。L2太小,即使處理器速度很快,那也無法把數據即時傳入進行處理,將會制約處理器的整體性能。 CPU產品中,一級緩存的容量基本在4KB到64KB之間,二級緩存的容量則分為128KB、256KB、512KB、1MB、2MB等。一級緩存容量各產品之間相差不大,而二級緩存容量則是提高CPU性能的關鍵。二級緩存容量的提升是由CPU製造工藝所決定的,容量增大必然導致CPU內部晶體管數的增加,要在有限的CPU面積上集成更大的緩存,對製造工藝的要求也就越高。

二級緩存容量二級緩存

二級緩存容量緩存與命中

總所周知,處理器在緩存中找到需要的數據稱為“命中”,只有當緩存中沒有處理器所需的數據時(此時稱為未命中),處理器才會對內存進行訪問。鑑於處理器大都具有一級緩存和二級緩存。打個比方,比如在一顆擁有二級緩存的處理器中,處理器讀取一級緩存的命中率為80%,這説明處理器在一級緩存中能夠找到的所需要的數據佔所需數據總量的80%,另外剩下的20%處理器將會從二級緩存中去尋找,剩下的這20%數據是不可能從二級緩存中全部找到的,也會出現“未命中”,所以我們在此假定二級緩存的“命中率”也同樣為80%,找到剩餘20%所需數據中的80%,那麼還有總數據量的4%沒有被命中,此時處理器就不得不從內存中去調用這剩下的4%。

二級緩存容量性能

介於從處理器內部到一級緩存、二級緩存最後到內存的所需時間會越來越慢,所以緩存的命中率和主頻在理論上也會影響到緩存的性能表現,但實際使用中,純理論的情況會出現嗎?下面就通過測試來檢驗一下。
在《Quake4》的測試中,主頻共同提升到3.2G之後,512KB與1MB的性能差距從原有的23%下降到了20%。2MB與4MB的性能差距則有微弱的提升,從原有的8%提高到了9%。512KB與6MB的性能差距則沒有變化,主頻從2.66G提高到3.2G之後,兩者的性能差距依舊保持在相同的59%上。
在《半條命2》的測試中,512KB與1MB的性能差距從原有的23%提高到了25%。2MB與4MB的性能差距則有提升,從原有的25%提高到了28%。512KB與6MB的性能差距提升相對明顯,性能差距從2.66G主頻下的102%提高到了3.2G下的120%,有18%的提高。
在《英雄連》的測試中,提升頻率之後的512KB二級緩存和1MB二級緩存的性能差距為40%,略高於在2.66G主頻下的37%。而2MB與4MB的性能差距則從原有的14%提高到了16%。512KB與6MB的性能差距從原有的123%提高到了131%,可見在《英雄連》這種對處理器非常敏感的遊戲中,主頻越高,越能更好的發揮出大二級緩存的優勢。
通過上面的測試我們可以大致瞭解到,隨着主頻的提高,在大多數情況下,不同容量的二級緩存在性能上確實會有更大的性能差距。但是與主頻的提升並不成正比,在原有的基數比例下,當主頻同步提升20%的情況下,遊戲中大致會出現8%左右的緩存性能增長,最高時也僅僅達到18%(《半條命2》中)。

二級緩存容量主頻

一部分人都會有主頻越高,緩存“命中”率越大的認識,因為主頻的提高,自然會提高高速緩存與主緩存的存取時間,也有的會拿{Cache“命中”率=(平均存取時間-主存存取時間)/(高速緩存存取時間-主存存取時間)}這個公式來換算,但是這樣的計算結果顯然是沒有任何實際意義。因為當今緩存的“命中”率中都會採取極為高效、科學的算法來提高緩存的效率。在這種學術問題上永遠都會存在爭議,在這個問題上也沒有必要較真兒,作為消費者和玩家只需要知道,主頻的提高確實會提高緩存性能就可以了。

二級緩存容量技術應用

新的45nm工藝的使得Intel公司的工程師能夠在處理器核心內部放入更多的電子管。在此之前65nm雙核心Conroe E4XXX處理器共享二級緩存的容量為2M,而新款45nmWolfdale E7XXX處理器卻可以擁有3M的二級緩存,45nm E8XXX集成了6M的二級緩存。 45nm處理器除了二級緩存容量相比上代65nm產品高出50%以外,緩存的相聯度也有大幅度提升,擁有3MBL2緩存的Core 2 Duo E7000系列採用12-way,相對於採用8-way設計的E4000增加了一級;擁有6MB L2 cache的E8000則採用24-way相聯度設計,這就相當於在容量提升50%的同時位寬也同比提升。 [1] 

二級緩存容量容量影響

二級緩存容量CPU性能

假設有一個運算任務,要從“1”一直遞加到“999999”。在傳統的“實數據讀寫緩存”架構下,這一系列數據中最先用到的數據(如“1、2……449、450”)將存儲在CPU一級數據緩存中,更多的數據(如“451、452……899999、900000”)存儲在CPU二級緩存中,其餘的數據(如“900001、999002……999998、999999”)暫存在內存中,CPU將按照一級數據緩存、二級緩存和內存的順序讀取這些數據。
一級緩存的存儲方式
但是由於其一級數據緩存不存儲數據,數據存儲在二級緩存中,因此對二級緩存容量的依賴非常大,所以CPU需要更大的二級緩存容量才能發揮出應有的性能。在實際應用中,CPU處理的數據中大多數都是0KB~128KB大小的數據,128KB~256KB的數據約有10%,256KB~512KB的數據有5%,512KB~1MB的數據僅有3%左右。所以對於這種CPU來説,二級緩存容量從0KB增加到256KB對CPU性能的提高几乎是直線性的;增加到512KB對CPU性能的提高稍微小一些;從512KB增加到1MB,普通用户就很難體會到CPU性能有提高了。正因為如此,大家能感受到Pentium 4 C(512KB二級緩存)與Celeron(128KB二級緩存)的性能差異,卻很難感受到Pentium 4C(512KB二級緩存)與Pentium 4 E(1MB二級緩存)的性能差異了。
例如,同為2.8GHz主頻的Celeron D(256KB二級緩存)和Pentium 4 E(1MB二級緩存)運算104萬位的耗時分別為56秒和48秒 ,除去外頻(前者為133MHz,後者為200MHz)的差異和超線程技術的影響,兩者的性能差距只有10%左右,對於普通用户而言這樣的性能差距 是微不足道的;只有對CPU運算性能要求“苛刻”的玩家來説更大的二級緩存容量才是必須的。
相對的,由於AMD的Athlon 64/Athlon XP/Sempron/Duron系列產品的一級數據緩存直接存儲數據,而且128KB的容量在大多數情況下就 可以承擔CPU所急需的數據,所以其二級緩存對CPU性能的影響並沒有那麼大。這也就解釋了為什麼主頻外頻相同的Athlon XP(256KB或512KB二級緩存)和Duron(64KB二級緩存)雖然二級緩存容量差異巨大,但實際性能差距不大的原因。而且Athlon 64/Sempron 系列CPU在內存控制器、流水線長度、頻率、總線架構和擴展指令集等諸多方面與以前的產品都有差異,因此在性能上受二級緩存容量的影響就 更小了。綜上所述,在CPU性能方面,並非只從二級緩存容量上作對比就可以得到準確的答案,實際上還要考慮到緩存的總體設計結構、一級數 據緩存容量等因素。雖然從總體上來講,二級緩存容量越大越好,但是並不是二級緩存容量提高一倍就能使CPU性能提升一倍。因此對於一般家 庭用户來説,電腦主要是用來上網、欣賞音樂和電影以及文字處理,二級緩存為256KB的Celeron D或Sempron已經足夠了。只有對3D遊戲、辦公軟件和多媒體編輯性能要求較高的用户才需要更大二級緩存的CPU。 [2] 

二級緩存容量服務器

用來存放那些被CPU頻繁使用的數據,以便使CPU不必依賴於速度較慢的DRAM(動態隨機存儲器)。L2高速緩存一直都屬於速度極快而價格也相當昂貴的一類內存,稱為SRAM(靜態RAM),SRAM(Static RAM)是靜態存儲器的英文縮寫。由於SRAM採用了與製作CPU相同的半導體工藝,因此與動態存儲器DRAM比較,SRAM的存取速度快,但體積較大,價格很高。
PC及其服務器系統的發展趨勢之一是CPU主頻越做越高,系統架構越做越先進,而主存DRAM的結構和存取時間改進較慢。因此,緩存(Cache)技術愈顯重要,在PC系統中Cache越做越大。廣大用户已把Cache做為評價和選購PC系統的一個重要指標。
參考資料