靈感範文站

位置:首頁 > 實用文 > 實用文精選

CPU基礎知識多篇詳解

CPU基礎知識多篇詳解

CPU基礎知識大全詳解有哪些?CPU在電腦中是最核心關鍵的硬件之一,相當於人的大腦,決定了電腦運算能力,因此CPU的選擇至關重要。下面就讓小編帶你去看看CPU基礎知識大全詳解,希望對你有所幫助吧!

程序員必須瞭解的CPU知識 - 科普篇

1導讀

對於一名程序員來說,無論你使用的是什麼語言,代碼最終都會交給CPU來執行。所以瞭解CPU相關的知識一方面屬於程序員的內功,另一方面也可以幫助你在日常編寫代碼時寫出更加高效的代碼

本文不打算對CPU進行深入探究,相反是以簡單的語言來幫助大家瞭解CPU的工作原理以及不得不提到的CPU緩存相關知識,其中晦澀的內容我會通過配圖來幫助大家理解,最後會以幾個例子來幫助大家更直觀的感受到CPU緩存帶來的性能影響

2CPU基礎知識

CPU即Central ProcessingUnit(中央處理器),是我們的代碼打交道最多的硬件之一,要想讓一個CPU工作,就必須給它提供指令和數據,而這裏的指令和數據一般就放在我們的內存當中。其中指令就是由我們平常編寫的代碼翻譯而來,數據也是我們代碼中需要用到的數據(例如一個int值、一串字符串等等)

以C語言爲例,從我們開始編寫到運行的生命週期可以粗略的用下圖表示:

大致分爲以下幾個步驟

我們日常中使用編輯器或者IDE敲入代碼

代碼編寫完成後使用編譯和鏈接工具生成可以被執行的程序,也就是機器語言(指令的集合)

當程序被運行時,整個程序(包括指令和數據)會被完整的載入到內存當中

CPU不停的向內存讀取該程序的指令執行直到程序結束

通過上述第4步我們知道,CPU自身是沒有保存我們的程序的,需要不停的向內存讀取

那麼有個問題是CPU是如何向內存讀取的呢?

這裏其實存在一個“總線”的概念,即CPU會通過地址總線、控制總線、數據總線來與我們的內存進行交互。其中地址總線的作用是尋址,即CPU告訴內存需要哪一個內存地址上的數據;控制總線的作用是對外部組件的控制,例如CPU希望從內存讀取數據則會在控制總線上發一個“讀信號”,如果希望往內存中寫一個數據則會發一個“寫信號”;而數據總線的作用顧名思義就是用來傳輸數據本身的了

例如CPU需要希望從內存中讀一條數據,那麼整個過程爲:

到這裏我們已經知道了CPU在執行我們程序的過程中會不斷的與內存交互,讀取需要的指令和數據或者寫入相關的數據。這個過程是非常非常快的,一般CPU與內存交互一次需要200個時鐘週期左右,而現代的處理器單個時鐘週期一般都短於1納秒(1秒= 十億納秒)

但我們的前輩們仍然對這個速度不滿足,所以又對CPU設計了一套緩存系統來加速對內存中數據的讀取

3CPU緩存

現代CPU通常設計三級緩存(L1、L2、L3),其中L1、L2緩存是每個CPU核心獨享的,L3緩存是所有CPU核心共享的,而L1緩存又分爲數據緩存和指令緩存

我們的數據就從內存先到L3緩存中,再到L2緩存中,再到L1緩存中,最後再到CPU寄存器中

按照大小來看,通常L1 < L2 < L3 < 內存 <磁盤,如果你手邊有一臺Linu__機器的話,可以通過下面的命令查看CPU各級緩存的大小

以我手上這臺服務器爲例,L1指令緩存大小爲32K、數據緩存大小爲32K,L2緩存大小爲1MB,L3緩存大小爲35.75MB

按照速度來看,通常L1 > L2 > L3 > 內存 > 磁盤,以時鐘週期爲計量單位

L1緩存:約 4 個CPU時鐘週期

L2緩存:約 10 個CPU時鐘週期

L3緩存:約 40 個CPU時鐘週期

內存:約 200 個CPU時鐘週期

也就意味着如果能命中緩存,我們程序的執行速度至少提升5倍左右,如果能命中L1緩存則提升50倍左右,這已經屬於相當大的性能提升了

有了緩存系統後,CPU就不必要每條指令或數據都讀一次了,可以一次性讀取若干條指令或數據然後放到緩存裏供以後查詢,因爲根據局部性原理,CPU訪問內存時,無論是讀取指令還是數據,所訪問的內存單元都趨於聚集在一個較小的連續區域中,所以一次性讀取一塊連續的內存有利於後續的緩存命中

現實中,CPU通常情況下每次的讀取內存時都會一次性讀取內存中連續的64個字節,這個連續的64字節術語就叫做CacheLine(緩存行),所以每一級CPU緩存就像下面這樣

如果你手邊有一臺Linu__機器的話,可以通過下面的命令查看你的機器使用的CPU的Cache Line大小是多少

對於我的服務器來說,L1緩存就有 32KB / 64B = 512 個Cache Line

到這裏,我們已經知道了CPU緩存的工作原理和加載方式,這裏實際上還遺留了兩個話題沒有講,一個是如何組織每一級的 Cache Line(例如 L1 的512 個CacheLine)來提升訪問的命中率;另一個更加複雜一點,在現代CPU都是多核的場景下如何保證數據的一致性,因爲每個核都有自己的L1和L2緩存,那麼如果核心1修改的時候只修改了緩存的數據而沒有修改內存中的數據,其他核心讀到的就是舊數據了,如何解決這一問題?

由於本篇文章只是期望對CPU知識進行一個科普,不希望對於小白來說一次性接觸大量的新內容,所以這兩個問題我準備在後面的另外兩篇再進行更細緻的討論

4性能對比

下面以幾個實際的例子來加深大家對Cache Line如何影響程序性能的理解

示例一

我們假設有一個5000萬長度的int數組,接着把這個數組的其中一些元素乘以2,考慮下面這兩份代碼

直覺上代碼一比代碼二少循環了4倍,並且也少乘2了4倍,理論上代碼一比代碼二快4倍左右才合理

但在我的服務器上運行的結果是代碼一平均花費90毫秒,代碼二平均花費93毫秒,性能幾乎是差不多的,讀者可以自行思考一下原因,再點擊下方空白處查看解析

點擊下方空白區域查看解析

解析

這裏最主要的原因還是CacheLine,雖然代碼一需要執行的指令確實比代碼二要少4倍,但由於CPU一次會把連續的64個字節都讀入緩存,而讀寫緩存的速度又特別快(還記得嗎?L1的讀取速度只有約4個時鐘週期,是內存的50倍),以至於我們很難察覺到這4倍指令的差距

示例二

假設我們需要遍歷一個二維數組,考慮下面這兩種遍歷方法:

由於數組長度是一模一樣的,直覺上我們期望的是兩份代碼運行時間相差無幾。但在我的服務器上代碼一運行需要23毫秒,代碼二運行需要51毫秒,讀者可以自行思考一下原因,再點擊下方空白處查看解析

點擊下方空白區域查看解析

解析

這裏最主要的原因依然是Cache Line,由於C語言中二維數組的內存是連續的,所以我們按行訪問的時候訪問的一直都是連續的內存,而CacheLine也是連續的64個字節,所以按行訪問對Cache Line更友好,更容易命中緩存

而按列訪問的話每次訪問的內存不是連續的,每次的跨度都是256__sizeof(int)也就是1KB,更容易出現緩存Miss

示例三

假設我們有一個數組,我們希望計算所有大於100的元素的和,考慮下面兩份代碼

其中代碼一是隨機生成了個長度爲1000W的數組,然後統計大於100的所有數字的和;代碼二也是隨機生成了個長度爲1000W的數組,但是是先排完序,再統計大於100的所有數字的和。並且可以看到,兩份代碼都是隻計算了統計sum的那段代碼的消耗時間,所以兩份代碼都不考慮隨機生成數組和排序花費的時間

理論上來講兩份代碼花費時間應當是相差無幾的,但實際上在我的機器上跑出來第一份代碼輸出的是46毫秒,第二份代碼輸出的是23毫秒

讀者可以自行思考一下原因,再點擊下方空白處查看解析,提示:第二份代碼中在統計sum之前數組是有序的

電腦CPU如何選購?臺式機CPU知識掃盲和選購建議

CPU有幾個重要的參數:架構、主頻、核心、線程、緩存、接口。

架構:

有句老話叫“拋開架構看核心主頻都是耍流氓”,那什麼是架構?假如我們把架構想象成交通工具,那麼老的架構就是火車,而新的架構就是高鐵,所以架構的提升直接影響CPU的性能。這也就是爲什麼老式的CPU雖然也有超高的主頻但性能還是被現在的i3碾壓的原因了。

電腦CPU如何選購?臺式機CPU知識掃盲和選購建議

主頻:

我們常在CPU的信息裏看到某某CPU主頻3.6GHz,這裏的主頻其實是CPU內核工作的時鐘頻率,並不直接等於CPU的運算速度,但是高的主頻對於CPU的運算速度卻至關重要。

核心:

核心又稱內核,是CPU用來完成所有計算、接受/存儲命令、處理數據等任務的裝置。我們可以簡單的把核心理解爲人的手,單核就是一隻手、雙核就是兩隻手、四核就是四隻手。

核心數並不是越多越好的,要看使用場景,比如在打字的時候,兩隻手就比一隻手效率高,但是在操作鼠標的時候,使用兩隻手只會起到適得其反的效果。至於什麼場景需要使用多少核心的CPU在下面會講到。

電腦CPU如何選購?臺式機CPU知識掃盲和選購建議

線程:

我們通常會看到“四核四線程”和“四核八線程”這兩種說法,我們可以簡單的把工廠裏的流水線比作線程,把工人比作核心,早先由於工人工作技能不高,一個工人只能處理一條流水線的任務,我們可以把這個稱爲單核單線程,但是後來工人技術熟練了,覺得操作一條流水線很無聊,不能體現自己的價值,於是就給又分配一條流水線,讓這個工人同時處理兩條流水線的任務,我們可以把這個稱爲“單核雙線程”。

緩存:

緩存也是CPU裏的一項非常重要的參數,由於CPU的運算速度比內存條的讀寫速度要快很多,這會讓CPU花費很長的時間等待數據的到來或是把數據寫入內存條,這個時候CPU內的高速緩存可以作爲臨時的存儲介質來緩解CPU的運算速度與內存讀寫速度不匹配的矛盾,所以緩存越大越好。

電腦CPU如何選購?臺式機CPU知識掃盲和選購建議

接口:

CPU需要通過接口安裝在主板上才能工作,而目前CPU的接口都是針腳式接口,AMD和英特爾的CPU在接口上就有很大的差別,所以需要使用適配接口的主板才能正常工作。目前英特爾主流的接口類型爲LGA-1151接口(6、7、8代i3i5 i7都是這種接口);AMD平臺主流的接口類型有AM4接口(銳龍系列)和FM2+接口(速龍系列、APU系列)。

PS:英特爾最新的酷睿8代CPU雖然也是LGA-1151接口,但不適配老式的LGA-1151接口主板的平臺,需要另購主板

說完了這些重要的參數,相信你也對CPU有了一個大概的瞭解,我們再談談不同場景對CPU的選擇。

計算機系統基礎:CPU相關知識筆記

1、什麼是CPU

計算機的基本硬件系統由運算器、控制器、存儲器、輸入設備、輸出設備5大部件組成。

運算器和控制器等部件被集成在一起稱爲中央處理單元(Central Processing Unit,CPU)

是硬件系統的核心。

2、CPU的用途

CPU主要負責獲取程序指令、對指令進行譯碼並加以執行。

CPU的功能如下:

3、CPU的組成

CPU主要由運算器、控制器、寄存器和內部總線等部件組成。

3.1

運算器

運算器包括算術邏輯單元(ALU)、累加器、緩衝寄存器、狀態條件寄存器等。它的主要工作是完成所規定的的各種算術和邏輯運算。

算術邏輯單元(ALU):ALU的重要組成部件,負責處理數據,實現算術和邏輯運算。

累加器(AC):當執行算術或邏輯運算時,爲ALU提供一個工作區。

數據緩衝器(DR):作爲CPU和內存、外部設備之間數據傳送的中轉站、操作速度的緩衝;

在單累加器結構的運算器中,DR還可以作爲操作數寄存器。

狀態寄存器(PSW):保存算術指令和邏輯指令運行或測試的結果建立的的各種條件碼內容,分爲狀態標誌和控制標誌。

3.2

控制器

用於控制這個CPU的工作,不僅要保證程序的正確執行,還要能處理異常事件。

控制器主要包括指令控制邏輯、時序控制邏輯、總線控制邏輯、中斷控制邏輯。

3.2.1

指令控制

指令寄存器(IR):當執行一條指令時,需要先把它從內存存儲器取到緩衝寄存器中,再送入IR中暫存,指令譯碼器會根據IR的內容產生各種微操作命令,控制其他部件協調工作,完成指令的功能。

程序計數器(PC):PC具有寄存和計數兩種功能。又稱爲指令計數器。

地址寄存器(AR):用來保存當前CPU所訪問的內存單元地址。

指令譯碼器(ID):包含指令操作碼和地址碼兩部分,爲了能執行任何給定的指令必須對操作碼進行分析,以便識別要進行的操作。

3.2.2

時序控制

時序控制要爲每條指令按時間順序提供應有的控制信號。

3.2.3

總線控制

爲多個功能部件提供服務的信息通路的控制電路。

3.2.4

中斷控制

用於控制各種中斷請求,並根據優先級排隊,逐個交給CPU處理。

3.3

寄存器組

分爲專用寄存器、通用寄存器。運算器和控制器中的寄存器是專用寄存器,作用是固定的。

通用寄存器用途廣泛由程序員規定其用途。

4、什麼是多核CPU

內核:CPU的核心稱爲內核,是CPU的最重要組成部分。CPU的所有計算、接收/存儲命令、處理數據都是由核心執行。

多核:在一個單芯片上集成兩個或者更多個處理器內核,並且每個內核都有自己的邏輯單元、控制單元、中端處理器、運算單元、一級Cache、二級Cache共享或獨有。

多核CPU優點:可滿足用戶同時進行多任務處理等要求。

標籤:CPU 多篇