音頻處理 (一) 音頻文件

来源:http://www.cnblogs.com/mwwf-blogs/archive/2017/09/11/7502355.html
-Advertisement-
Play Games

音頻文件 音頻文件是對聲音進行數字轉換之後存放的數據文件,瞭解音頻數據必須先知道幾個重要概念。 1. 採樣:對聲音信息錄入時,行進的最小操作單位,一般一次採樣具有左右2個聲道,每個聲道用1或2個位元組來存儲; 這樣採樣的量化位數是8位,或16位(樣本位寬),量化位數越高聲音音質越好;就像11位電話號碼 ...


音頻文件

   音頻文件是對聲音進行數字轉換之後存放的數據文件,瞭解音頻數據必須先知道幾個重要概念。

1. 採樣:對聲音信息錄入時,行進的最小操作單位,一般一次採樣具有左右2個聲道,每個聲道用1或2個位元組來存儲;

這樣採樣的量化位數是8位,或16位(樣本位寬),量化位數越高聲音音質越好;就像11位電話號碼表示的號碼比7位要多得多;

2. 採樣頻率:每秒採樣次數,單位Hz,一般的音頻文件有11.025kHz22.05kHz44.10kHz等;顯然,這種模-數信息的轉換,每秒採樣次數越多,聲音就越精確;

3. 碼率:每秒編碼的bit數,單位是kb/s;計算方式:位寬×聲道數×採樣頻率;(單位是bit不是位元組)

4. 聲道數,固定值為1-單聲道,或者2-雙聲道,雙聲道時,每個採樣樣本中包含左聲道、右聲道的音頻數據,因此兩者的數據是交錯排列的;

 

 (一)Wave 格式

    WAVE是微軟開發的聲音文件格式,用於保存Windows平臺的音頻信息資源,文件尾碼名*.wav;支持多種壓縮演算法、多種音頻位數、採樣頻率和聲道;

    標準的wav文件採用44.1kHz採樣頻率,16位量化位數,聲音文件質量幾與CD相當;Wave格式不對源數據做任何處理,如果源數據是無損的,編碼後的Wav文件也是無損的;如果源數據是有損的,編碼後的Wav文件也是有損的;

1. Wave文件的構成:

RIFF 標 志 4B "RIFF"
數據大小 4B -
格式 4B "WAVE"
fmt 標誌 4B "fmt "
結構體大小 4B 16/18
結構體 16B/18B  
data 標誌 4B "data"
聲音數據大小 4B -
data -

 

 

 

 

 

 

 

 

 

 

 

 

 

2. Wave文件的詳細結構:

// RIFF 標準媒體流文件頭
struct Riff_Header
{
char szRiffId[4]; // 'R','I','F','F' DWORD dwRiffSize; // Size, 除了這 8 個位元組之外,文件剩餘大小,等於文件總位元組數-8 char szRiffFormat[4]; // 'W','A','V','E' }; struct Fmt_Block { char szFmtId[4]; // 'f', 'm', 't',' ' DWORD dwFmtSize; // Size 為 16 或 18 WORD wFormatTag; // 編碼方式,一般為 0x0001 WORD wChannels; // 聲道數 1--單聲道 2--雙聲道 DWORD dwSamplesPerSec; // 採樣頻率 /Hz DWORD dwAvgBytesPerSec; // 每秒位元組數 WORD wBlockAlign; // 數據塊對齊單位(每個採樣需要的位元組數) WORD wBitsPerSample; // 每個採樣需要的 bit // WORD wBits; // 可能有可能沒有,由dwFmtSize欄位決定 }; //Fact_Block 塊,有些 wav 文件中沒有 struct Fact_Block { char szFactId[4]; // 'f','a','c','t' DWORD dwFactSize; // }; //數據塊 struct Data_Block { char szDataId[4]; //'d','a,','t','a' DWORD dwDataSize; // 音頻數據大小 //data ... };

 說明:

1. RIFF塊裡面的 dwRiffSize 表示的是整個文件除開頭8個位元組之外的大小0x24 0xCD 0x01 0x00,即 118,052 Byte,通過文件屬性查得文件大小是118,060Byte;

2. dwFmtSize 0x10 0x00 0x00 0x00,即為16;fmt塊的剩餘部分是一個波形信息結構,是微軟定義的:

/*
 *  extended waveform format structure used for all non-PCM formats. this
 *  structure is common to all non-PCM formats.
 */
typedef struct tWAVEFORMATEX
{
    WORD        wFormatTag;         /* format type */
    WORD        nChannels;          /* number of channels (i.e. mono, stereo...) */
    DWORD       nSamplesPerSec;     /* sample rate */
    DWORD       nAvgBytesPerSec;    /* for buffer estimation */
    WORD        nBlockAlign;        /* block size of data */
    WORD        wBitsPerSample;     /* number of bits per sample of mono data */
    WORD        cbSize;             /* the count in bytes of the size of */
                                                                                      /* extra information (after cbSize) */
} WAVEFORMATEX, *PWAVEFORMATEX, NEAR *NPWAVEFORMATEX, FAR *LPWAVEFORMATEX;
WAVEFORMATEX

3. Data塊:dwDataSize表示音頻數據的大小,0x00 0x01 0xCD 0x00,即118,016,略小於118,052,說明文件末有部分無效數據

 

 (二) MP3格式

     MP3格式(待續 ...)

 

 

 

 

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 我用的是phpstudy安裝的mysql資料庫,但是在服務中沒有mysql的啟動項(不影響使用),原因是在安裝mysql的時候沒有安裝mysql 服務 解決辦法如下: 1. 用管理員身份運行cmd.exe(註意管理員身份!) 2. 進入mysql的bin目錄 3. 安裝mysql服務 安裝服務:my ...
  • 1、查詢工資為2500到4000的人數 方式一: select count(*) from emp where sal>=2500 and sal<=4000; 方式二: select count(*) from emp where sal between 2500 and 4000; 2、查詢每個 ...
  • 本文出處:http://www.cnblogs.com/wy123/p/7501261.html (保留出處並非什麼原創作品權利,本人拙作還遠遠達不到,僅僅是為了鏈接到原文,因為後續對可能存在的一些錯誤進行修正或補充,無他) 資料庫在處理併發事物的過程中,在不同的隔離級別下有不同的鎖表現,在非可序列 ...
  • MySQL事務: 1.MySQL事務控制語句 (1).開啟事務 begin; (2).提交事務 commit; (3).回滾事務 rollback; (4).設置事務是否自動提交 set autocommit = {0 | 1}; // 0不自動提交,1自動提交 例如: begin;// 開啟事務 ...
  • 1、連接池概念 用池來管理Connection,這樣可以重覆使用Connection。有了池,我們就不用自己來創建Connection,而是通過池來獲取Connection對象。當使用完Connection後,調用Connection的close()方法也不會真的關閉Connection,而是把Co ...
  • 命名規範: 命令中的選項和參數: ...
  • 在管理端一鍵部署nfs rsync 並且實時同步 實現非密碼非互動式一鍵部署 還會繼續增加新的東西 未完待續 ip:管理 61 nfs 131 rsync 141 web 108 管理端 : 齊天大聖的總的腳本 [root@m01 tools]# cat quanwang.sh#!/bin/bash ...
  • 在上一篇博客中,寫到瞭如何使用rpm命令來安裝、卸載軟體等,但是大家都知道,各個軟體包之間可能存在依賴關係,如果安裝某個軟體需要額外的依賴其他若幹的包,那麼我們就需要將其他額外的包一個一個的安裝上去,這樣的一個過程是非常耗時的,所以出現了一個前端工具,如yum,dnf,apt-get等,本次博客就c ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...