並行計算——緒論

来源:https://www.cnblogs.com/dbai/archive/2023/06/18/17488988.html
-Advertisement-
Play Games

# 一、緒論 ## 1.1 基本概念 1. 加速比:表示加速效果。單個處理器運行花費時間 / P個處理器運行花費時間;$S=\frac{T(1)}{T(p)}$ 2. 效率:$E = \frac{S}{p} = \frac{T(1)}{T(p)\times p}$ 3. 開銷:$C=T(p)\tim ...


一、緒論

1.1 基本概念

  1. 加速比:表示加速效果。單個處理器運行花費時間 / P個處理器運行花費時間;\(S=\frac{T(1)}{T(p)}\)
  2. 效率:\(E = \frac{S}{p} = \frac{T(1)}{T(p)\times p}\)
  3. 開銷:\(C=T(p)\times p\)
  4. 可擴展性:處理器數目增多時並行程式的行為;
  5. 計算通信比:計算花費時間 / 處理器消息通信花費時間;
  6. 計算:在1個時間單位內,每個PE(處理單元)能完成2個數相加,併在本地記憶體保存計算結果;
  7. 通信:在3個單位時間內,一個PE能夠把數據從自己的本地記憶體發送到另一個PE的本地記憶體;
  8. 輸入和輸出:程式開始時,整個輸入數組A保存在0號處理單元PE0,程式結束時,計算結果應匯聚到PE0;
  9. 同步:所有PE同時進行計算、通信,或處於閑置狀態;

1.2 求和案例

1.2.1 分配流程

PE = 1:即為串列。

PE = 2:PE#0分1半任務給PE#1,分別計算,PE#1將求和後數據匯聚到PE#0。

image-20230617004458512

PE = 4:

image-20230617004714400

1.2.2 分發時間計算

以PE = 2為例

  1. 最初PE#0存儲全部數據;
  2. PE#0發送一般數據給PE#1,花費3個單位時間;(自己規定的,見1.2.4)
  3. 每個處理單元將數據相加,花費511個單元時間;(因為每個處理器分別有511個數據)
  4. PE#1求和後數據返回給PE#1,花費3個單元時間;
  5. PE#0把2部分數據相加,花費1個時間單元;

共計 3 + 511 + 3 + 1 個時間單元

通用表達式

使用\(p=2^{q}\)個處理單元,以及\(n=2^{k}\)個輸入整數

  • 數據分發次數:\(3 \times q\)
  • 本地求和:\(\frac{n}{p} -1 = 2^{k-q}-1\)
  • 收集中間數據:\(3 \times q\)
  • 中間結果求和::\(q\)

則共 \(T(p,n)=T(2^{q},2^{k})=3q+2^{k-q}-1+3q+q=2^{k-q}-1+7q\)

1.2.3 擴展性分析

強擴展性分析:改變處理器的數量,並行計算時間、加速比、開銷和效率變化規律;

弱擴展性分析:改變處理器的數量,同時改變數據量,並行計算時間、加速比、開銷和效率變化規律;

上述演算法不是強擴展性,是弱擴展性。

1.2.4 一般情形計算

$\alpha $:執行一次單獨的假髮操作需要的時長

$\beta $:傳輸一批整數需要的時長;

運行時間:\(T_{\alpha,\beta }(p,n)=T(2^{q},2^{k})=\beta q+\alpha(2^{k-q}-1)+\beta q+\alpha q=2\beta q +\alpha (2^{k-q}-1 + q)\)

加速比:$S_{\alpha ,\beta } (2^{q}, 2^{k})=\frac{T_{\alpha ,\beta }(2^{0}, 2^{k})}{T_{\alpha ,\beta }(2^{q}, 2^{k}) }=\frac{\alpha(2^{k}-1)}{2\beta q + \alpha(2^{k-q}-1+q)} $

通信比:\(\gamma=\frac{\alpha}{\beta}\)

求解最優單元:\(2^{q}={\frac{\gamma\ln2}{2+\gamma}}2^{k}\)

比如,對於\(\gamma=\frac{1}{3},n=1024\),加速比最大可求\(p=1000\)

當處理數據規模固定,並行效率和加速比依賴於計算單元個數和計算通信比;

1.3 並行計算基礎

1.3.1 分散式記憶體

特點:每個PE只能訪問自己的本地記憶體,如果跨PE訪問,需要一個顯式的通信步驟。

數據劃分是分散式記憶體系統編程的關鍵。

image-20230618123227022

1.3.2 共用記憶體系統

通過一個共用匯流排或者縱橫交換機,所有的CPU都能訪問同一塊公共記憶體空間。

  • 除了共用主存外,每個核心包含一塊更小的本地記憶體;
  • 緩存一致性,存儲在本地緩存中的值和存儲在共用記憶體中的值保持一致;

image-20230618123237716

1.4 並行程式設計考慮因素

  1. 劃分:給定的問題劃分為子問題;
  2. 通信:選定劃分方案決定了進程或縣城之間需要的通信量和通信類型;
  3. 同步:為了以正確的方式共同運行,線程或進程之間可能需要同步操作;
  4. 負載平衡:多個縣城或多個進程之間的工作量需要平均分配,以平衡他們各自的負載,並最小化空閑時間;

求和案例

image-20230618123941539

1.5 不同層次的並行

  1. 節點級並行化:需要針對分散式記憶體機器的模型實現演算法,例如MPI(在第9章深入學習)或者UPC++(在第10章深人學習)等。
  2. 節點內的並行化:通常基於針對共用記憶體系統(多核CPU)的語言,比如C++多線程(在第4章深人學習),或者OpenMP(在第6章深人學習)。
  3. 加速卡級的並行化:把一部分計算任務分配給加速卡承擔,比如大規模並行GPU等,藉助包括CVDA在內的特定語言(將在第7章深入學習)。

image-20230618124555139
參考:《並行程式設計》


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • > 我們之前對Redis的學習都是在命令行視窗,那麼如何使用Java來對Redis進行操作呢?對於Java連接Redis的開發工具有很多,這裡先介紹通過Jedis實現對Redis的各種操作。(前提是你的redis已經配置了遠程訪問) ## 1.創建一個maven工程,並且添加以下依賴 ~~~xml ...
  • 利用Python調用外部系統命令的方法可以提高編碼效率。調用外部系統命令完成後可以通過獲取命令執行返回結果碼、命令執行的輸出結果進行進一步的處理。本文主要描述Python常見的調用外部系統命令的方法,包括os.system()、os.popen()、subprocess.Popen()等。 本文分析 ...
  • pymongo模塊是python操作mongo數據的第三方模塊,記錄一下常用到的簡單用法。 **首先需要連接資料庫:** - MongoClient():該方法第一個參數是資料庫所在地址,第二個參數是資料庫所在的埠號 - authenticate():該方法第一個參數是資料庫的賬號,第二個參數是數 ...
  • # Go 語言之 Viper 的使用 ## Viper 介紹 [Viper](https://github.com/spf13/viper): ### 安裝 ```bash go get github.com/spf13/viper ``` ### Viper 是什麼? Viper 是一個針對 Go ...
  • 以WebMvcAutoConfiguration自動配置的原理為例,SpringBoot內部對大量的第三方庫或Spring內部庫進行了預設配置,這些配置是否生效,取決於我們是否引入了對應庫所需的依賴,如果有那麼預設配置就會生效。如果引入springboot-starter-web那麼對應的web配置 ...
  • `NumPy`(Numerical Python)是一個`Python`庫,主要用於高效地處理多維數組和矩陣計算。它是科學計算領域中使用最廣泛的一個庫。 在`NumPy`中,**數組**是最核心的概念,用於存儲和操作數據。 `NumPy`數組是一種多維數組對象,可以存儲相同類型的元素,它支持高效的數 ...
  • 一、簡介 官網: https://spring.io/projects/spring-framework#overview 官方下載工具: https://repo.spring.io/release/org/springframework/spring/ github下載: https://git ...
  • # 頁面預覽 ## 預約掛號 - 根據預約周期,展示可預約日期,根據有號、無號、約滿等狀態展示不同顏色,以示區分 - 可預約最後一個日期為即將放號日期 - 選擇一個日期展示當天可預約列表 ![image-20230227202834422](https://s2.loli.net/2023/06/1 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...