聊聊GPU與CPU的區別_ZenDei技術網路在線

作者：小牛呼嚕嚕 | https://xiaoniuhululu.com 電腦內功、JAVA底層、面試相關資料等更多精彩文章在公眾號「小牛呼嚕嚕」前言大家好，國慶馬上就要過去了，這不偷偷地進來學習了一波。之前小牛學過一點深度學習的知識，做了幾個項目，發現CPU來訓練就很慢，但是後來用裝有GP ...

前言
CPU是什麼？
GPU是什麼？
GPU與CPU的區別

作者：小牛呼嚕嚕 | https://xiaoniuhululu.com
電腦內功、JAVA底層、面試相關資料等更多精彩文章在公眾號「小牛呼嚕嚕」

前言

大家好，國慶馬上就要過去了，這不偷偷地進來學習了一波。之前小牛學過一點深度學習的知識，做了幾個項目，發現CPU來訓練就很慢，但是後來用裝有GPU的電腦來訓練，就明顯快的飛起，感覺很神奇。
此時心裡有個疑問，CPU造價那麼昂貴，性能比起記憶體、機械硬碟、固態硬碟，快的不是一個數量級的，這個GPU竟然比CPU還要厲害？

讓我們一起進入電腦的世界，一起來看看GPU和CPU！

CPU是什麼？

CPU,中央處理器(Central Processing Unit)是一臺電腦的運算核心和控制核心。CPU、內部存儲器和輸入/輸出設備是電子電腦三大核心部件。其功能主要是解釋電腦指令以及處理電腦軟體中的數據。

GPU是什麼？

GPU,圖形處理器(Graphic Processing Unit)。一個專門的圖形核心處理器。GPU是顯示卡的“大腦”，決定了該顯卡的檔次和大部分性能，同時也是2D顯示卡和3D顯示卡的區別依據。2D顯示晶元在處理3D圖像和特效時主要依賴CPU的處理能力，稱為“軟加速”。3D顯示晶元是將三維圖像和特效處理功能集中在顯示晶元內，也即所謂的“硬體加速”功能。

GPU與CPU的區別

GPU的由來

電腦對圖像進行實時渲染，一般需要經過圖形流水線的過程：頂點處理->圖元處理->柵格化->片段處理->像素操作, 期間需要大量的計算，比如 640×480的解析度的屏幕，為了顯示游戲畫面，大概有30萬個像素需要渲染，為了讓人眼看到畫面動起來，其不像電影一樣只需要24幀，至少需要60幀，即每秒我們需要完成1800 萬次單個像素的渲染，每個像素都需要經過圖形流水線過程，需要耗費大量資源

隨著圖像處理對於電腦來說越來越重要，CPU越來越不從心了。CPU需要很強的通用性來處理各種不同的數據類型，同時又要邏輯判斷又會引入大量的分支跳轉和中斷的處理。這些都使得CPU的內部結構異常複雜。

另一方面，當晶元的集成度增加後，漏電流也隨之增大，但時鐘頻率的提高有限，而且晶體管的線寬很快就會到達物理極限，因此晶元的性能很難靠減小晶體管線寬來提高。所以工程師們開始想辦法在設計上做文章：由於圖像渲染的流程是固定的，通過硬體來解決這個問題，那就設計一個不需要考慮CPU的流水線停頓、亂序執行、分支預測、記憶體管理、IO等等的各類問題的晶元，這其實就是GPU。

並行計算

我們重點再介紹一下CPU並行，即並行計算

並行計算(Parallel Computing)是指同時使用多種計算資源解決計算問題的過程，是提高電腦系統計算速度和處理能力的一種有效手段。它的基本思想是用多個處理器來共同求解同一問題，即將被求解的問題分解成若幹個部分，各部分均由一個獨立的處理機來並行計算。

並行計算可分為時間上的並行和空間上的並行

時間上的並行是指流水線技術，採用流水線，可以在同一時間啟動兩個或兩個以上的操作，大大提高計算性能。
空間上的並行是指多個處理機併發的執行計算，即通過網路將兩個以上的處理機連接起來，達到同時計算同一個任務的不同部分，或者單個處理機無法解決的大型問題。

GPU架構優化

我們來看看，現代的 GPU 為了圖形渲染、深度學習上有相較於CPU更強大的性能，做出來哪些設計上的優化：

由於GPU不需要考慮CPU的流水線停頓、亂序執行、分支預測等等的各類問題,只需要流式計算的功能，所以內部許多CPU的電路是不需要的，這樣就節約了大量空間
由於GPU相比CPU電路就簡單多了，這樣就可以塞入更多的電路，即更多的"核"，他們都是並行的，能夠極大提升性能
除了塞更多的核，為了更大程度提升GPU的性能，還採用 SIMT技術，可以把多條數據，交給不同的線程去處理。類似於CPU中，SIMD技術，但是其只能一次性取出了固定長度的多個數據，放到寄存器裡面，用一個指令去執行
GPU同樣採用超線程技術，當任務計算遇到停頓的時候，調度一些別的計算任務給當前的 ALU，這樣就需要保證核心中提供更多的執行上下文給ALU算數計算單元使用

我們再看看下麵的CPU和GPU的架構圖，想必會有所得

CPU架構圖

GPU架構圖

從架構圖我們就能很明顯的看出，GPU的構成相對簡單，GPU採用流式並行計算模式，每一個計算單元可以單獨負責一個像素點，每個像素點不依賴旁邊像素點的數據，所以每個計算單元都是獨立並行的，不需要控制器額外干涉。CPU的核數一般2,4,8核；但是GPU可以達到上千核
擁有數量非常多的計算單元和超長的流水線，計算能力非常強悍，特別適合處理大規模併發計算

我們需要知道GPU無法單獨工作，必須由CPU進行控制調用才能工作。CPU可單獨作用，處理複雜的邏輯運算和不同的數據類型，但當需要大量的處理類型統一的數據時，則可調用GPU進行並行計算。

GPU和CPU的應用場景

小結一下

CPU需要很強的通用性來處理各種不同的數據類型，同時又要邏輯判斷又會引入大量的分支跳轉和中斷的處理。這些都使得CPU的內部結構異常複雜，採用的是精兵戰術，能力強，但數量少，擅長邏輯控制，串列運算。
GPU面對的則是類型高度統一的、相互無依賴的大規模數據和不需要被打斷的純凈的計算環境，採用的是人海戰術，單個能力弱，但數量眾多，擅長的是大規模併發計算。

雖然GPU是為了圖像處理而生的，隨著時代的發展，現在GPU不僅可以在圖像處理領域大顯身手，它還被用來深度學習、科學計算、密碼破解、數值分析，海量數據處理，金融分析等需要大規模並行計算的領域。

參考資料：
《深入淺出電腦組成原理》

https://blog.csdn.net/shuiyixin/article/details/82915378

https://www.sohu.com/a/201309334_468740

https://zhuanlan.zhihu.com/p/156171120

本篇文章到這裡就結束啦，很感謝你能看到最後，如果覺得文章對你有幫助，別忘記關註我！更多精彩的文章