聊聊GPU與CPU的區別

来源:https://www.cnblogs.com/xiaoniuhululu/archive/2022/11/07/16865198.html
-Advertisement-
Play Games

作者:小牛呼嚕嚕 | https://xiaoniuhululu.com 電腦內功、JAVA底層、面試相關資料等更多精彩文章在公眾號「小牛呼嚕嚕 」 前言 大家好,國慶馬上就要過去了,這不偷偷地進來學習了一波。之前小牛學過一點深度學習的知識,做了幾個項目,發現CPU來訓練就很慢,但是後來用裝有GP ...


目錄

作者:小牛呼嚕嚕 | https://xiaoniuhululu.com
電腦內功、JAVA底層、面試相關資料等更多精彩文章在公眾號「小牛呼嚕嚕 」

前言

大家好,國慶馬上就要過去了,這不偷偷地進來學習了一波。之前小牛學過一點深度學習的知識,做了幾個項目,發現CPU來訓練就很慢,但是後來用裝有GPU的電腦來訓練,就明顯快的飛起,感覺很神奇。
此時心裡有個疑問,CPU造價那麼昂貴,性能比起記憶體、機械硬碟、固態硬碟,快的不是一個數量級的,這個GPU竟然比CPU還要厲害?

讓我們一起進入電腦的世界,一起來看看GPU和CPU!

CPU是什麼?

CPU,中央處理器(Central Processing Unit)是一臺電腦的運算核心和控制核心。CPU、內部存儲器和輸入/輸出設備是電子電腦三大核心部件。其功能主要是解釋電腦指令以及處理電腦軟體中的數據。

GPU是什麼?

GPU,圖形處理器(Graphic Processing Unit)。一個專門的圖形核心處理器。GPU是顯示卡的“大腦”,決定了該顯卡的檔次和大部分性能,同時也是2D顯示卡和3D顯示卡的區別依據。2D顯示晶元在處理3D圖像和特效時主要依賴CPU的處理能力,稱為“軟加速”。3D顯示晶元是將三維圖像和特效處理功能集中在顯示晶元內,也即所謂的“硬體加速”功能。

GPU與CPU的區別

GPU的由來

電腦對圖像進行實時渲染, 一般需要經過圖形流水線的過程:頂點處理->圖元處理->柵格化->片段處理->像素操作, 期間需要大量的計算,比如 640×480的解析度的屏幕,為了顯示游戲畫面,大概有30萬個像素需要渲染 ,為了讓人眼看到畫面動起來,其不像電影一樣只需要24幀,至少需要60幀, 即每秒我們需要完成1800 萬次單個像素的渲染,每個像素都需要經過圖形流水線過程,需要耗費大量資源

隨著圖像處理對於電腦來說越來越重要,CPU越來越不從心了。CPU需要很強的通用性來處理各種不同的數據類型,同時又要邏輯判斷又會引入大量的分支跳轉和中斷的處理。這些都使得CPU的內部結構異常複雜。

另一方面,當晶元的集成度增加後,漏電流也隨之增大,但時鐘頻率的提高有限,而且晶體管的線寬很快就會到達物理極限,因此晶元的性能很難靠減小晶體管線寬來提高。所以工程師們開始想辦法在設計上做文章:由於圖像渲染的流程是固定的,通過硬體來解決這個問題,那就設計一個不需要考慮CPU的流水線停頓、亂序執行、 分支預測、記憶體管理、IO等等的各類問題的晶元 ,這其實就是GPU。

並行計算

我們重點再介紹一下CPU並行,即並行計算

並行計算(Parallel Computing)是指同時使用多種計算資源解決計算問題的過程,是提高電腦系統計算速度和處理能力的一種有效手段。它的基本思想是用多個處理器來共同求解同一問題,即將被求解的問題分解成若幹個部分,各部分均由一個獨立的處理機來並行計算。

並行計算可分為時間上的並行空間上的並行

  1. 時間上的並行是指流水線技術,採用流水線,可以在同一時間啟動兩個或兩個以上的操作,大大提高計算性能。
  2. 空間上的並行是指多個處理機併發的執行計算,即通過網路將兩個以上的處理機連接起來,達到同時計算同一個任務的不同部分,或者單個處理機無法解決的大型問題。

GPU架構優化

我們來看看,現代的 GPU 為了圖形渲染、深度學習上有相較於CPU更強大的性能,做出來哪些設計上的優化:

  1. 由於GPU不需要考慮CPU的流水線停頓、亂序執行、 分支預測等等的各類問題,只需要流式計算的功能,所以內部許多CPU的電路是不需要的,這樣就節約了大量空間
  2. 由於GPU相比CPU電路就簡單多了,這樣就可以塞入更多的電路,即更多的"核",他們都是並行的,能夠極大提升性能
  3. 除了塞更多的核,為了更大程度提升GPU的性能,還採用 SIMT技術, 可以把多條數據,交給不同的線程去處理。類似於CPU中,SIMD技術,但是其只能一次性取出了固定 長度的多個數據,放到寄存器裡面,用一個指令去執行
  4. GPU同樣採用超線程技術, 當任務計算遇到停頓的時候,調度一些別的計算任務給當前的 ALU,這樣就需要保證核心中提供更多的執行上下文給ALU算數計算單元使用

我們再看看下麵的CPU和GPU的架構圖,想必會有所得

  1. CPU架構圖

  1. GPU架構圖

從架構圖我們就能很明顯的看出,GPU的構成相對簡單,GPU採用流式並行計算模式,每一個計算單元可以單獨負責一個像素點,每個像素點不依賴旁邊像素點的數據,所以每個計算單元都是獨立並行的,不需要控制器額外干涉。CPU的核數一般2,4,8核;但是GPU可以達到上千核
擁有數量非常多的計算單元和超長的流水線,計算能力非常強悍,特別適合處理大規模併發計算

我們需要知道GPU無法單獨工作,必須由CPU進行控制調用才能工作。CPU可單獨作用,處理複雜的邏輯運算和不同的數據類型,但當需要大量的處理類型統一的數據時,則可調用GPU進行並行計算。

GPU和CPU的應用場景

小結一下

  1. CPU需要很強的通用性來處理各種不同的數據類型,同時又要邏輯判斷又會引入大量的分支跳轉和中斷的處理。這些都使得CPU的內部結構異常複雜,採用的是精兵戰術,能力強,但數量少,擅長邏輯控制,串列運算。
  2. GPU面對的則是類型高度統一的、相互無依賴的大規模數據和不需要被打斷的純凈的計算環境,採用的是人海戰術,單個能力弱,但數量眾多,擅長的是大規模併發計算。

雖然GPU是為了圖像處理而生的,隨著時代的發展,現在GPU不僅可以在圖像處理領域大顯身手,它還被用來深度學習、科學計算、密碼破解、數值分析,海量數據處理,金融分析等需要大規模並行計算的領域。

參考資料:
《深入淺出電腦組成原理》

https://blog.csdn.net/shuiyixin/article/details/82915378

https://www.sohu.com/a/201309334_468740

https://zhuanlan.zhihu.com/p/156171120


本篇文章到這裡就結束啦,很感謝你能看到最後,如果覺得文章對你有幫助,別忘記關註我!更多精彩的文章


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 知道的朋友瞭解 我不是屬於講按部就班技術的那種人。什麼xx入門 ,入門到精通,入門到入土。 其實非要嚴格說的話已經跟angularjs 什麼ajax 偏的有點遠了,之所以還是叫這個名稱,因為都屬於web應用 ,叫這個名稱是一種延續,其實這個系列持續了幾年了 是我自己從學習到一種適合我自己環境的特有應 ...
  • nuget打包靜態資源的問題 前段時間做了個區劃包, 爬了點數據生成了一個 region-tree.json 文件, 存放了全國一直到街道級的區劃數據 然後又寫了點代碼解析處理這個文件 當時的 csproj 中對這個資源是這樣引用的 <ItemGroup> <None Include="region ...
  • 一、系統日誌管理 1 系統日誌介紹 1.1 sysklogd 系統日誌服務 CentOS 5 之前版本採用的日誌管理系統服務 klogd: linux kernel 記錄內核日誌 syslogd: system application 記錄應用日誌 1.2 rsyslog 系統日誌服務 rsyslo ...
  • 今天安裝這個gitlab,雖然中間遇到了很多問題,但好在最後都一一解決了,有問題就得多查查別人怎麼解決的,當然也需要我們自己的細緻觀察和嚴謹思考。後面有時間再寫下如何使用gitlab創建一個倉庫及一些常用配置吧。 ...
  • summary: [Linux 掛載共用存儲] 概述 將Windows共用文件夾和NAS存儲掛載至Linux。 Linux系統環境:CentOS 掛載共用存儲 查看外部主機共用了哪些目錄 smbclient -L //10.127.224.59 創建掛載目錄:mkdir /home/share 臨時 ...
  • 記在Linux系統實現用nginx解析php 實驗環境: 系統版本:CentOS 7 nginx版本:nginx-1.6.0 (http://mirrors.sohu.com/nginx/nginx-1.6.0.tar.gz ) php版本:php-5.3.28 (http://museum.php ...
  • OmniPlan Pro 4 for Mac是應用在Mac上的最好用的項目流程管理工具,以拖放支持為特點,對您日常工作想法做記錄,幫助我們創建合乎邏輯的項目計劃管理,OmniPlan 4 Mac版全新設計,拖放支持更加簡單,但卻更加先進強大,它還能被用來優化資源、精簡預算快速共用或添加任務。 詳情: ...
  • 記在Linux系統源碼包安裝MySQL實驗環境:系統版本:CentOS 7MySQL版本:5.7.39(https://downloads.mysql.com/archives/get/p/23/file/mysql-5.7.39-el7-x86_64.tar.gz)實驗開始步驟一安裝依賴yum - ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...