視音頻基礎知識——視音頻解碼——視音頻編碼——視音頻轉碼——視音頻播放——具體應用——其他高階內容 其實就對應於你在通信原理里學過的基本通信模型,下麵以流媒體傳輸系統為例畫個對應項示意圖,基本上除了中間通道的部分,都是編解碼生涯中要研究的東西。 下麵我針對學習路線中的各部分單獨做一下介紹 視音頻基礎 ...
視音頻基礎知識——視音頻解碼——視音頻編碼——視音頻轉碼——視音頻播放——具體應用——其他高階內容
其實就對應於你在通信原理里學過的基本通信模型,下麵以流媒體傳輸系統為例畫個對應項示意圖,基本上除了中間通道的部分,都是編解碼生涯中要研究的東西。
下麵我針對學習路線中的各部分單獨做一下介紹
視音頻基礎知識:
- 視頻、圖像、音頻的格式。這裡的“格式”是一個廣義的概念,既包括MP4,FLV這樣的封裝格式,也包括H264,MPEG2這樣的編碼格式,還包括420 422 444這樣的取樣格式,甚至RGB,HSV,YUV這樣的彩色空間也可以算作一種格式,將來在應用時還可能會遇到RTMP,HLS這樣的流媒體傳輸協議或者其他的協議,都可以算作格式。這些紛繁複雜的格式就好比學英語時要背的單詞,初學的時候可能覺得看不見摸不著,將來落實到代碼上卻是一目瞭然的,但是這個“背單詞”的過程一定不能省。在一些論壇里經常能看到很多寫代碼的高手受困於不懂這些基本的概念,大概就是基礎沒打好。
- 資訊理論以及壓縮編碼入門。在你學習前面的各種格式時不可避免地會涉及到一些壓縮編碼的知識,隨便拿一本講視頻編碼的書,前面的緒論也都會簡單講講資訊理論知識。簡單來說,你需要知道視音頻為什麼要壓縮編碼,為什麼可以實現壓縮編碼,怎樣評價壓縮編碼的質量,以及具體編碼過程中的一些概念,比如型(profile)和級(level),GOP,IPB幀,NAL單元,巨集塊,運動矢量、量化參數,幀內編碼(當然你首先要知道幀率、場頻這類的概念),幀間預測,這一大堆的概念,在不同的編碼標準中還會有各種專屬的概念。覺得前途黑暗想要放棄嗎?不要怕,下麵我會給你推薦一些參考書,看上一兩本就差不多入門了。
如果說前面的各種格式相當於英語中的單詞的話,這部分很顯然就是語法了。
其他。相信你已經感覺到了,視音頻基礎知識確實是非常雜的,除了前面提到的“單詞”和“語法”之外,還會有“視音頻質量評價”這樣的概念,我也不知道要怎麼歸類,差不多可以算是應用吧。說到視音頻技術的應用,流媒體應用是很大的一塊,那麼這其中又涉及到很多的電腦網路知識。再比如高階應用中的“硬體加速”,就又涉及到更多高端內容了。這些東西在你以後的工作中慢慢積累就好,還是那句話,不要怕。
扯蛋。閑著沒事的時候玩玩單反、攝像機、非編軟體,學校或者自己有條件的話去參觀一下電視臺,關註一下索尼佳能尼康松下等廠家的產品彩頁及說明書,實踐對於加深理解基礎知識非常有用。
視音頻編碼、解碼、轉碼:
在你學過前面的基礎知識後,是時候上手實踐了。編解轉碼方面有很多開源工程在業內外都得到了廣泛的應用,最著名的是ffmpeg。你的編解碼生涯有一半可能都要耗在ffmpeg身上了,這個項目是如此龐大,如此牛逼,我都不知道該怎麼介紹了,而且你在學習這個項目的過程中也可以接觸到包括x264在內的一大票其他開源項目。