數字信號處理專題(2)——利用FPGA進行基本運算及特殊函數定點運算

来源:https://www.cnblogs.com/moluoqishi/archive/2018/11/18/9951866.html
-Advertisement-
Play Games

一、前言 FPGA以擅長高速並行數據處理而聞名,從有線/無線通信到圖像處理中各種DSP演算法,再到現今火爆的AI應用,都離不開卷積、濾波、變換等基本的數學運算。但由於FPGA的硬體結構和開發特性使得其對很多演算法不友好,之前本人零散地總結和轉載了些基本的數學運算在FPGA中的實現方式,今天做一個系統的總 ...


一、前言

  FPGA以擅長高速並行數據處理而聞名,從有線/無線通信到圖像處理中各種DSP演算法,再到現今火爆的AI應用,都離不開卷積、濾波、變換等基本的數學運算。但由於FPGA的硬體結構和開發特性使得其對很多演算法不友好,之前本人零散地總結和轉載了些基本的數學運算在FPGA中的實現方式,今天做一個系統的總結歸納。

二、FPGA中的加減乘除

1.硬體資源

  Xilinx 7系列的FPGA中有DSP Slice ,叫做“DSP48E1”這一專用硬體資源,這是一個功能強大的計算單元,單就用於基本運算的部分有加減單元和乘法器。詳見參考文獻1.

  因此可以直接用HDL語言中的加、減、乘符號實現變數與常量間運算操作以及變數與變數間操作。而四則運算中的除法沒有基本的邏輯計算單元可以對應,因此計算除法需要調用除法器IP核。

2.確認數據的表示範圍

  有符號數:(補碼)-2^(N-1) ~ 2^(N-1)-1 如N = 8,則表示範圍是:-128 ~ 127.

    無符號數:0~2^N-1 如N = 8,則表示範圍是:0~255.

  定點數:2Q13 範圍是:-4~4-2^(-13) 精度是:2^(-13)

3.結果有效位寬

  首先討論結果位寬問題。在FPGA中往往採用定點運算替代浮點運算來降低硬體資源占用率和計算延遲,其中的精髓就是精度與資源的權衡。若按照保留計算結果的全部精度,N bit數與Mbit數相加結果需要N+1bit(N>M)。N bit數與M bit數相乘之積需要N+M bit。而減法可以轉化為加法,除法則轉換為乘法和加減法的組合。如果操作數是定點小數,則在滿足以上準則的前提下,A與B相加(A小數點位數>B小數點位數),結果小數點位數與A相同;A與B相乘(小數點位數分別為p和q),結果小數點位數是p+q。

4.定點運算步驟

  然而(話鋒一轉),在大多數場合下,不需要以上這麼多位來保留計算結果,因為我們在進行數學運算時,已經知道輸入數據的大致範圍,一個數除以1000和除以1結果數據所需最小位寬能一樣麽?加減運算的操作步驟是先對齊小數點位數,後加減。而乘法是先計算後取小數點。這實際上與十進位運算一致,我們看看具體的計算步驟:

整數之間加減以及乘法的統一步驟:預估結果位寬N --> 按照結果位寬擴展操作數符號位以防止溢出 --> 運算取低N位。

定點小數加減運算步驟:預估結果位寬N --> 得到結果小數點後位數 --> 對齊操作數整數位和小數位,確定擴展位寬M(M≥N) --> 加減運算取低M位。

定點小數乘法運算步驟:預估結果位寬N --> 得到結果小數點後位數 --> 擴展操作數位寬 --> 相乘取低N位

5. 變數與常量運算化簡

  以上討論的均是兩變數之間的運算規則,當然結果位寬及格式準則是適用的。變數與常量的運算的優勢在於,可以將乘除法轉換成加減以及移位運算實現,從而降低計算複雜度和延遲。當常數項C為2的整數次冪(C = 2^p),則乘C等於變數左移p位,除以C等於變數右移p位。幾個在書中看到的幾個簡單示例:A*16 = A <<4  A*20 = A<<4 + A<<2.  A除以2 = A >>1  A除以3 = A*(0.25+0.0625+0.0156) = A>>2+A>>4+A>>6  A除以5 = A*(0.125+0.0625+0.0156) = A>>3 + A>>4 + A>>6.其中乘法完全等價對應的移位相加操作,而除法的移位代替會損失精度。

三、如何計算特殊函數

  FPGA內部的DSP Slice可以直接進行最基本的加法和乘法運算,但是對於其他比如對數、指數、三角函數、開根號等特殊函數就無能為力了。這時需要藉助演算法對這些特殊函數進行變換和簡化。FPGA實現複雜函數的常用手段一個是級數展開,再一個就是CORDIC演算法。關於CORDIC的理論知識和具體內容詳見參考文獻2,這裡主要闡述CORDIC的IP核調用以及應用示例。CORDIC演算法就是通過一定的手段,將很多複雜的特殊函數變為相加移位運算,這一點對於硬體晶元實現來說非常友好。CORDIC分為旋轉模式和矢量模式,配合圓周坐標、線性坐標和雙曲線坐標會有六種組合,具體見下表:

   從表中發現,基本的乘除法、三角函數、反三角函數、雙曲函數、反雙曲函數、開根號都能夠直接求得,那其他函數怎麼辦?

   常見的函數計算需求基本都能滿足,雖上述變換式對自變數定義域有限制,但同樣可以分析輸入數據的取值範圍並利用簡單的數學變換得到想要的結果。Xilinx同時提供了浮點IP核以及CORDIC IP核,前者調用簡單但占用資源大,延遲高,因此利用CORDIC演算法計算函數是個較好的選擇。

四、CORDIC計算e^x Demo

1. 演算法模擬分析

   要計算e^x數值需要讓CORDIC工作在雙曲坐標的旋轉模式下,通過e^x = sinhx+coshx關係式間接求得。首先看下sinh和cosh函數的曲線,有個直觀認識。

                                                   

  我們用MATLAB毫不費力地驗證一下公式正確性:

  在設計後也同樣要藉助MATLAB進行模擬驗證。

2. CORDIC IP核

  現在通過查看user guide得知CORDIC IP核的介面及主要特性。

  介面包括輸入笛卡爾數據輸入通道、相位輸入通道、全局信號以及數據輸出通道。該IP核有兩種結構:串列和並行,可根據數據吞吐量需求選擇,並行結構可以每個時鐘輸出一個計算結果。如果計算sinh和cosh,要向phase通道輸入相位信息,X_OUT是cosh(phase),Y_OUT是sinh(phase).輸入phase必須滿足數據範圍,否則出現不可預計結果。輸出幀結構及數據範圍如下:

  其中輸入數據格式為2QN,輸出則是1QN。由於均是有符號數,也就是輸入整數部分3bit,輸出整數部分2bit。接下來對IP核進行配置,重點是第一頁,此處將其配置為計算sinh和cosh模式,採用並行優化的流水線結構。相位以角度為單位,輸入輸出位寬設置成16bit。

 3.HDL代碼設計及模擬驗證

設計代碼:

 1 `timescale 1ns / 1ps
 2 
 3 module cordic_ex#(parameter DIN_W = 16,
 4                             DOUT_W = 16)
 5 (
 6     input                       clk,
 7     input      [DIN_W-1:0]      din,//2Q13
 8     input                       din_vld,
 9 
10     output reg [DOUT_W+1-1:0]   dout = 0,//2Q14
11     output reg                  dout_vld = 0   
12 );
13 
14 
15 wire [DOUT_W*2-1 : 0] m_axis_dout_tdata;
16 wire m_axis_dout_tvalid;
17 wire signed [DOUT_W-1:0] sinh,cosh;
18 
19 // ex = sinhx + coshx <1Q14+1Q14 = 2Q14>
20 always  @(posedge clk)begin
21     dout <= sinh + cosh;
22 end
23 
24 assign sinh = m_axis_dout_tdata[DOUT_W*2-1 -:DOUT_W];
25 assign cosh = m_axis_dout_tdata[DOUT_W-1 -:DOUT_W];
26 
27 always  @(posedge clk)begin
28     if(m_axis_dout_tvalid)begin
29         dout_vld <= 1'b1;
30     end
31     else
32         dout_vld <= 0;
33 end
34 
35 cordic_0 cordic_cosh_sinh (
36   .aclk(clk),                                // input wire aclk
37   .s_axis_phase_tvalid(din_vld),  // input wire s_axis_phase_tvalid
38   .s_axis_phase_tdata(din),    // input wire [15 : 0] s_axis_phase_tdata
39   .m_axis_dout_tvalid(m_axis_dout_tvalid),    // output wire m_axis_dout_tvalid
40   .m_axis_dout_tdata(m_axis_dout_tdata)      // output wire [31 : 0] m_axis_dout_tdata
41 );
42 
43 endmodule
cordic_ex

  用MATLAB產生兩組數據,並將角度值定點化後作為設計模塊數據激勵:

testbench:

 1 `timescale 1ns / 1ps
 2 
 3 module cordic_ex_tb();
 4 
 5 parameter CYC = 20;
 6 
 7 reg clk;
 8 reg [16-1:0] din;
 9 reg din_vld;
10 
11 wire signed [17-1:0] dout;
12 wire dout_vld;
13 
14 cordic_ex#(.DIN_W(16),
15            .DOUT_W(16))
16  uut(
17    .clk       (clk)  ,
18    .din       (din)  ,//2Q13
19    .din_vld   (din_vld)  ,
20    .dout      (dout)  ,//2Q14
21    .dout_vld  (dout_vld)     
22 );
23 
24     initial begin
25         clk = 1;
26         forever #(CYC/2) clk = ~clk;
27     end
28 
29     initial begin
30         #1;
31         din = 0;
32         din_vld = 0;
33         #(CYC*10);
34 
35         din_vld = 1;
36         din = 16'b0001010000011011;//pi * 1/5
37         #(CYC*1);
38         din = 16'b1110011011011110;//-pi * 1/4
39         #5;
40         $stop;
41     end
42 
43 endmodule
cordic_ex_tb

模擬結果:

   模擬波形表明,計算結果與MATLAB浮點運算相近,滿足一般計算需求。若想提高精度,可以增加CORDIC輸出數據位寬。

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

參考文獻:

1 ug479 7 Series DSP48E1 Slice User Guide.

2 Xilinx CORDIC演算法(非常經典)_圖文_百度文庫 https://wenku.baidu.com/view/6c623aa8910ef12d2bf9e732.html


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 這次我們繼續探險,來搞定 python 中的模塊(module)。**兵馬未動,糧草先行**,開工之前先看看基礎是否補齊了。 ...
  • 之前一直用的mysql5.5,最近發現Mysql8更新了很多新特性以及查詢效率的提升,覺得很有必要更新下開發版本,好,廢話不多說: 1、下載安裝包,下載地址:mysql8.0 。如果你想要下載其它版本可以選擇:mysql歷史版本地址。 2、下載好,刪除phpstudy的mysql目錄。如果數據重要的 ...
  • 自己做開發也有兩年多了吧,其中也關註過許多大牛的博客,買過許多的書看. 自己也是個比較愛閱讀的人,從小的時候被老爸逼著每次寒暑假看書,到後來慢慢長大愛上了閱讀,習慣了看書. 農村的小孩嗎,那時候又不像現在.只有通過閱讀去認知這個世界. 做開發以來陸陸續續的看過幾篇文章介紹相關書籍的,自己通過百度,也 ...
  • 偏函數應用舉例:路燈指示牌 ...
  • devtools模塊,是為開發者服務的一個模塊。主要的功能就是代碼修改後一般在5秒之內就會自動重新載入至伺服器,相當於restart成功。與JRebel不同的是,JRebel是一款商業插件,devtools是免費的。是boot的一個熱部署工具,當我們修改了classpath下的文件(包括類文件、屬性... ...
  • Python基礎知識(7):數據基本類型之元組、字典 一、元組 用括弧把元素括起來中間用逗號隔開。用逗號分開一些值便可創建元組 結果: (1, 2, 3) 空元組可以用沒有包含任何內容的兩個圓括弧表示,如()。 1、元素不可被修改,不能進行增加、刪除操作 2、建議寫元組的時候在右括弧的左邊加一個逗號 ...
  • sorted()方法 sorted()可用於任何一個可迭代對象。 原型為sorted(iterable, cmp=None, key=None, reverse=False) iterable:一個可迭代對象; cmp:用於比較的函數,比較什麼由key決定; key:用列表元素的某個屬性或函數進行作 ...
  • 前言 這部修改器製作有一段時間了,但是一直沒出教程。今天利用周末空閑寫篇教程,給後來者指路的同時也加深自己對游戲修改器的理解,大佬就隨便看看吧 瀏覽了一下網路,形形色色的單機游戲修改器教程,但是基本只實現了一到兩個功能,GUI圖形界面也沒有。網站上能下載到的實現很多功能的修改器卻又不開源,對新手不夠 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...