最近有一點個人的時間,嘗試一下自己翻譯一下英文的 Optimizing graphics rendering in Unity Games, 這兒附上英文鏈接: 個人英文水平有限,unity圖像學知識也是入門,希望通過這次翻譯能增進自己的圖形學知識,若有錯誤,歡迎各位大神指點,讓我也學習進步,謝謝。 ...
最近有一點個人的時間,嘗試一下自己翻譯一下英文的 Optimizing graphics rendering in Unity Games,
這兒附上英文鏈接:
個人英文水平有限,unity圖像學知識也是入門,希望通過這次翻譯能增進自己的圖形學知識,若有錯誤,歡迎各位大神指點,讓我也學習進步,謝謝。
介紹
本文主要學習在Unity進行一幀的渲染的時候,觀察到的場景背後的運行原理,在渲染的時候會有什麼樣性能問題發生以及如何解決這些渲染相關的問題。
在開始閱讀這篇文章之前,首先需要知道對於渲染問題是沒有萬能的解決之法的。渲染的結果受到游戲中眾多因素的影響,同時也極其依賴於游戲所運行的硬體條件和操作系統。最重要的一點,是要記住我們需要通過分析,實驗和測試,嚴密的分析測試結果來解決渲染性能問題。
本文主要分析常見的渲染問題並提供相應問題的解決辦法及其鏈接,並不能完全概括渲染的問題,所以本文主要旨在提供解決的思路並提供一些較為有效的查找辦法的途徑。
渲染的簡單介紹
在開始本文之前,讓我們快速的回顧一下在Unity的一幀渲染中發生的事情。理解下麵的一些概念和關係對於解決渲染性能問題有較大的幫助。
註意:在全文中我們會使用"object"來代表游戲中需要被渲染的物體,任何帶有渲染組件的物體都可以被稱為object。
從最基本的角度看,渲染過程的組件可以分為:
. CPU,主要計算出需要被渲染的對象和渲染的方式;
. GPU,CPU將渲染指令發送給GPU
. GPU根據CPU的渲染指令進行渲染工作
本文接下來會詳細介紹這幾步流程,現在只需要熟悉這幾個關鍵辭彙並理解其在渲染過程中所扮演的角色。
渲染管道常常被這生動的用來描述渲染的過程,高效的渲染過程就是保持信息的流動。CPU在每幀的渲染過程中的工作主要包括:
. CPU檢查場景中的object是否需要被渲染。一個object只有滿足一定的條件才可以被渲染,例如它的部分模型處於相機的視角範圍內 View frustrum。被剔除的object是不會被渲染的,更多關於相機視角和視角剔除的信息可以點擊這裡
. CPU收集需要被渲染的object並將其排序為渲染指令(Draw calls)。一個DC主要包含一個網格的數據和其渲染方式,例如其中哪個貼圖需要被使用。在通常情況下,使用相同的DC的objects會被合併,這種合併不同渲染objects的操作就是批處理(batching)。
. CPU對每個DC中的數據進行批處理打包,有時打包的結果有時更多的包含的是數據而不是DC,但是這對渲染影響不大,所以本文並不考慮這些情況。
對於每個包含DC的打包指令,CPU必須進行以下處理:
. CPU發送一個指令改變當前的渲染狀態(render state)。這個指令叫做 SetPass call,主要用來告訴GPU下一個被渲染的網格的渲染設置,該指令也只有在下一個渲染網格的渲染設置和當前的設置不同的時候會被髮送。
. CPU發送DC給GPU,DC指令主要操作GPU採用最近的SetPass Call 設置來對特定的網格進行渲染。
.在一些情況下,在一個batch中會有多個pass(shader中的一部分代碼),如果一個pass中要求新的渲染狀態(render state),那麼CPU就會發送一個新的SetPass指令給GPU,然後重新發送DC指令。
與此同時,GPU需要進行如下操作:
. GPU根據指令的順序處理渲染任務。
. 如果當前的任務是SetPass Call,那麼更新當前的渲染狀態。
. 如果當前任務為DC,GPU就渲染網格。 根據shader代碼中的不同步驟進行渲染。該部分的渲染較為複雜,在此並不做深入闡述,但是瞭解shader中的 vertex shader有利於瞭解GPU是如何處理網格中的頂點數據,瞭解shader中的 fragment shader有利於瞭解GPU是如何繪製每個單獨的像素點。
. 這個過程會重覆的進行直到CPU中發送過來的渲染指令都被處理完。
在瞭解了Unity在進行一幀的渲染中的操作後,現在我們考慮在渲染中的一些問題。
渲染問題的分類
對於渲染,有一個關鍵點是:CPU和GPU必須在渲染的一幀中完成各種的任務,如果任何一個花費較長時間來完成,則會造成一幀的渲染延遲。
渲染的問題主要有兩個基本的因素。第一因素是低效的渲染管道,如果在渲染管道過程中某個或者多個步驟消耗較長時間就會造成渲染管道的低效,從而中斷數據流,這也被稱為渲染瓶頸。第二個因素是渲染管道中數據過多,即使是最高效的渲染管道在每幀的渲染處理中也有數據量大小的限制。
如果渲染問題來自於CPU在計算渲染任務時耗時過長,則將其稱為 CPU bound, 如果渲染問題來自於GPU渲染耗時過長,則將其稱為 GPU bound。
瞭解定位渲染問題
在我們進行任何渲染改進之前,可以利用分析工具來瞭解定位造成渲染問題的原因。不同的問題有不同的解決辦法,同時我們需要測量我們的改進結果。解決渲染性能問題是一個平衡的操作,提升一方面的性能會對另一方面的性能造成相反的效果。
我們將利用兩種unity中的工具來定位渲染性能問題:Profiler window 和 Frame Debugger.
The Profiler window
利用profiler window 我們可以查看到游戲運行時各個方面的實時數據,包括記憶體使用,渲染管道和腳本的性能。如果你對profiler window還不是很熟悉,可以點擊此處this page of the Unity Manual,使用文檔:文檔
The Frame Debugger
利用Frame Debugger可以瞭解每幀的渲染操作及其詳細的渲染信息,比如每個DC中渲染的是什麼,每個DC的shader屬性,GPU接收到的渲染指令順序等。利用渲染信息可以幫助我們瞭解到游戲中的渲染情況從而提升游戲的性能。
如果你對Frame Debugger不是很瞭解,可以點擊此處:this page of the Unity Manual ,視頻展示點擊此處:視頻展示
查找造成渲染性能問題的原因
在我們嘗試改進渲染問題的時候,我們必須確定游戲運行較慢的原因是由渲染問題造成,如果游戲運行較慢來自於游戲腳本運行複雜則優化渲染無濟於事,可以通過此處來確定是否由於渲染造成游戲運行較慢:點擊此處
一旦我們確定游戲運行較慢來自於渲染,則需要確定是由於CPU還是GPU,不同的問題有不同的解決辦法,所以在解決問題前定位問題非常重要,如果你不確定渲染問題來自於CPU還是GPU,可以點擊:點擊此處
在定位渲染問題來自於CPU還是GPU後,下麵詳細介紹各自的解決辦法,參看下一篇文章。