示例代碼托管在: "http://www.github.com/dashnowords/blogs" 博客園地址: "《大史住在大前端》原創博文目錄" 華為雲社區地址: "【你要的前端打怪升級指南】" [TOC] 一. 高性能動畫 動畫的流暢程度通常是以 ( Frame Per Second ,每秒 ...
目錄
示例代碼托管在:http://www.github.com/dashnowords/blogs
博客園地址:《大史住在大前端》原創博文目錄
華為雲社區地址:【你要的前端打怪升級指南】
一. 高性能動畫
動畫的流暢程度通常是以FPS
(Frame Per Second,每秒幀率)作為衡量的。在攝像機錄製視頻時每一幀實際上包含了一段時間內的畫面記錄(長曝光攝影的道理相同的),如果畫面里的事物在運動,那麼暫停播放時看到的畫面通常都是模糊的,這樣的畫面也被稱為“模糊幀”,加上雙眼“視覺暫留”效果的影響,影視作品一般只要達到24FPS
就可以展示出看起來連續運動的畫面;而在頁面的渲染中,每一幀都是由電腦計算渲染出來的精確畫面,幀和幀之間並不存在模糊過渡,所以通常認為需要達到50FPS~60FPS
的幀率,才能夠得到較好的觀看體驗。
為了達到儘可能接近60FPS
以上的幀率,瀏覽器每一幀的計算和繪製所花費的時間就需要控制在1000/60≈16.6ms以內,根據Google開發者社區提供的資料,開發者最好能夠將所有的工作控制在10ms
左右,以便給瀏覽器一些處理內部工作的時間,否則就無法在限定的時間內完成畫面更新,動態的內容就會表現出卡頓,對用戶體驗造成負面影響。下一節就來看一下,在這16ms
的時間里,瀏覽器都需要完成哪些任務。
二. 像素渲染管線
基本渲染流程
談起瀏覽器的工作流程,你可能會在大多數文章中見過下麵這張圖:
它直觀地描述了瀏覽器如何將HTML
文件和CSS
樣式文件通過逐步處理最終合成渲染樹並展示在頁面上的過程,當然其中每一步都是非常複雜的,如果你對此還不熟悉,可以通過【瀏覽器的工作原理:新式網路瀏覽器幕後揭秘】這篇文章進行瞭解(極力推薦這篇文章!)。但實際上上面的流程里並沒有覆蓋網站的整個生命周期,它只是描述了從用戶獲取到網站首頁和資源文件後到完成首屏渲染這段時間內所做的工作,儘管工作流程幾乎是一致的,但諸如響應用戶的交互動作,在頁面上實現動畫等等內容,只通過上面的巨集觀原理圖理解起來還是很困難的。當開發者談及瀏覽器渲染性能的話題時,我們通常會聽到“重排”、“重繪”等術語,實際上它們就是對這後半部分工作的描述,它被稱為“瀏覽器像素渲染管線”,此時就需要祭出Google開發者社區提供的基本原理圖:
編寫在JavaScript
代碼中的那些事件監聽器、定時任務等等非同步觸發的代碼就會在橙色的部分執行,這部分代碼運行在主線程中,如果有問題的代碼或是執行時間較長的代碼在其中造成了阻塞,後續的幾個步驟就只能等著,這會直接延緩頁面的渲染甚至導致頁面直接崩潰,當JavaScript
執行完一個巨集任務並清空了當前的微任務隊列後,就會開始UI渲染流程,進入下一個環節。
在Style
階段需要找出發生變更的樣式並重新計算相關的尺寸,當然在首屏渲染之前第一次處理CSS
樣式時,瀏覽器肯定已經對計算結果進行了緩存,以便在這像素渲染管線處理時節省時間。
計算完樣式本身後,就需要進入Layout
階段,重新來計算發生樣式變動的元素應該以怎樣的盒模型尺寸繪製在畫面上的哪個位置,網頁中的基本排版遵循正常文檔流的規則,所以一個元素尺寸變化後,就有可能需要重新計算其父子元素或臨近元素的位置,不難想象這是一個極容易引發蝴蝶效應的環節。完成了Layout
佈局後,可以看到圖中使用的顏色也發生了變化,因為相對而言它們的開銷就比較輕量了。
Paint
階段就是生成像素數據的過程,它會將元素的背景、邊框、陰影等等可見的部分繪製出來,它們可能會被繪製在多個層上。
Composite
階段,由於繪製階段生成的畫面可能分佈於多個層,那麼最終渲染的結果就需要將它們按照一定的順序完成畫面的重疊,這就是瀏覽在合成階段主要的工作,當然這個過程並不一定是由CPU
獨自完成的,後面還會講到。當動畫執行時,瀏覽器會不斷創建幀,上面的過程就會反覆發生,從而實現幀畫面的不斷變動:
迴流和重繪
不同的CSS
樣式的性能開銷和造成的影響是不同的,所以上面的像素渲染管路的各個階段並不一定都有工作要做,如果發生變更的元素樣式不會造成佈局變化,那麼layout
階段就不需要做什麼工作,如果發生變更的CSS
屬性也可以不用重新計算各部分的像素顏色,那麼paint
階段也就沒有什麼工作要做,這樣渲染管路就被簡化成為:
這是我們最期望得到的理想狀態。如果發生變化的CSS
屬性導致Layout
階段任務量的增加,這類情況就被稱為“迴流”或“重排”,如果發生變化的CSS
屬性導致了Paint
階段任務量的增加,這類情況就被稱為“重繪”,它的開銷相比Layout
而言更小,從管線的特征不難明白,“迴流”必然會導致“重繪”,但反之則不一定成立。
只通過Composite
階段的工作就可以處理的CSS
屬性就是opacity
(透明度)和transform
(變形),它們是各類場景中優先推薦使用的性能最高的特性,transform
可以很方便地模擬出位置變化,在可以忽略畫面精度的情況下(例如純色的背景)也可以使用scale
來模擬尺寸變化。
所以在滿足需求的前提下,我們當然希望選擇改變性能開銷更小的屬性,以便可以在16ms
的時間內完成整個渲染管線的任務,這裡所說的性能,通常是指持續修改樣式時的性能開銷,暫不討論低頻的頁面狀態變動。關於CSS
屬相詳細的性能開銷,可以在【CSS Triggers】查看詳情,每個瀏覽器的實現上有細微的差別。
opacity
和transform
的動畫性能開銷最小,並不是因為處理它們造成的影響時工作量減小了,而是因為這兩個屬性造成的影響可以在圖層合成時可以委托給強大的GPU
來執行。GPU
的基本架構和CPU
不同,它擁有更多算術邏輯單元(也就是ALU
),這使得它非常適合以並行計算的形式執行計算密集型任務,例如圖形的矩陣變換、人工神經網路的訓練等等。
而opacity
和transform
造成的影響,都可以通過改變圖層合成時的參數來進行處理,換句話說就是它可以直接使用之前生成的點陣圖像素數據的緩存,而不需要再重新計算,也不用更新像素數據緩存,配合上GPU
強大的算力,性能自然很能打。
三. 舊軟體渲染
現代瀏覽器多採用軟硬體混合渲染的方式來處理,軟體渲染的方式通常也被成為“舊軟體渲染”(與之相對應的是硬體加速渲染),“舊”只是出現時間比較早,並不表示它已經被硬體渲染所取代。最初的網頁並不是作為完整的應用存在的,而只是用來做一些信息展示,二維渲染的場景居多(因為頁面上大多都是基於“盒模型”的矩形區域和文字包圍盒的計算和繪製),這時使用CPU
渲染的性能並不低,“舊軟體渲染”通常使用底層的二維圖形繪製庫,你可以藉助HTML Canvas 2D API
來類比理解,在canvas
畫板上實現的二維動畫,即使在逐幀動畫中進行覆蓋式的全畫布重繪,也能夠保持較高的幀率;對3D圖形學
有一定瞭解的小伙伴都知道,3D
渲染引擎只支持點、線和三角形的繪製,所以一個矩形就至少需要2個三角形來表示(當然也可是多個),直觀感覺上就是一種“殺雞用牛刀”的體驗,GPU
的算力雖然很牛逼,但通常記憶體空間非常有限,所以最好只在必要時有節制地使用GPU
。
本節我們先忘掉GPU
的加速能力,來看看軟體中需要如何處理頁面渲染。下麵以WebKit
內核為例來說明一下渲染的基本處理過程以及創建合成層的條件。想要進一步瞭解的小伙伴可以嘗試閱讀朱永勝的《WebKit技術內幕》一書(不要輕易嘗試,很容易覺得自己不適合搞前端,甚至懷疑人生)。
渲染對象(RenderObject)
在DOM
樹解析時,瀏覽器會為可見元素創建一個RenderObject
類的實例,用於記錄繪製這個節點需要的一些信息和方法,RenderObject
會依據HTML中的DOM結構生成一棵RenderObjectTree
,但瀏覽器並沒有直接使用它來生成一張點陣圖畫面,因為如果這樣做的話,頁面上發生任何變化時,都需要重新計算變更的區域並更新緩存,它的確很節省空間,畢竟只需要緩存一張靜態圖片中各個像素點的顏色數據就可以了,但節省空間的代價就是無法節省時間,這樣的策略會加重重覆運算的負擔。
渲染層(RenderLayer)
為了方便處理,WebKit
會根據RenderObjectTree
來對RenderObject
進行按層分類,並最終創建一棵包含多個渲染圖層信息的RenderLayerTree
(渲染層樹),兩棵樹中的節點並不是一一對應的,當遍歷RenderObjectTree
時,只有符合一定條件的節點(比如獲取了上下文的canvas節點、video節點、具有透明樣式的節點等等,詳細的規則會根據平臺實現不同可能會有變化)會創建出新的RenderLayer
節點,而其他的節點只需要添加到祖先節點上已經存在的RenderLayer
節點上就可以了。規則如下:
除了根節點以外,一個
RenderLayer
節點的父親,就是它對應的RenderObject
節點的祖先鏈中最近的祖先,且兩者所在的RenderLayer
不是同一個。
根據《Webkit技術內幕》一書中的介紹,在軟體渲染中,每一個RenderLayer
對象都會有一個後端類,用來存儲該層繪製的結果(但是在硬體渲染中由於合成層的存在,所以並不會為每一個RenderLayer
生成後端類),你可以把後端類簡單地理解為結果緩存,CPU
會將各個RenderLayer
的結果最終渲染為到一張點陣圖里,然後交給GPU
展示,合成的過程也可以在GPU
中進行,也就是硬體加速渲染,這裡不再展開,但是僅考慮軟體渲染環節的話,RenderLayer樹就已經可以實現目的了。用過photoshop
的用戶可能會對分層這種處理形式比較熟悉,它的關鍵點就是在處理有重疊的區域時必須考慮先後順序。
直接看概念可能比較繞,做個簡單的比喻,比如碼農小強的爺爺有自己的房子,然後生了幾個孩子,這些孩子里有的發展的比較好就自己買房單獨住處去了,發展的不太好的只能住在爺爺家裡,接著每個孩子又生了一堆孩子,也就是小強這一輩,當然也是發展的有好有差,以碼農小強為例,發展的好的就可以自己買房子住,發展的不好的就得拼爹了,如果他爹有房子,就可以住在爹家,如果很悲劇他爹也沒房子,那他就得和他爹一起住到他爹的爹家裡去(說住到墳墓里的你放學別走),RenderObject
到RenderLayer
的生成過程也是類似的。
四. 從canvas體會分層優勢
Webkit
底層的2D
渲染使用Skia
庫,它是類似於Canvas API
的二維圖形繪製庫,為了方便理解軟體渲染的優勢,下麵通過Canvas API
來看看分層到底帶來了哪些變化,本例中我們先不考慮重新計算佈局的情況,僅考慮重繪的工作。以下圖為例(如果不瞭解canvas
動畫繪製,可以參考筆者曾經寫的一篇相關博文【響應式編程的思維藝術 (2)響應式Vs面向對象】):
假設在下麵的分析中,地面
、天空
、山
、雲
和人
是分別繪製上去的,人物和雲是可以水平運動的,人比山距離觀察者更近。
不分層的情況
在canvas
中,使用context.getImageData(x, y, width, height)
方法取得畫布上對應矩形區域的像素數據,在不分層的情況下,假設第一次渲染後,使用這個方法將畫布中的像素數據取出來存儲在backUp
變數上(像素數據是一個很長的一維數組,按順序逐行存儲著畫面中每個像素點的rgba
4個值),也就是只為最終結果建立了一份緩存,此時實際上已經丟失了一部分信息了,例如雲和天空、人和天空都有重疊的部分,而重疊部分的像素只保留了最上面一層的值。
當需要繪製逐幀動畫時,問題就來了。人物是運動的,那麼程式自然知道下一幀應該將人物繪製在什麼地方,但是如果直接繪製,原來的人物仍然會留在圖中,這樣逐幀畫下去,畫面上就會留下一排人物運動的分解畫面,這顯然是不行的;如果把人物先擦掉呢?也是不行的,這樣雖然可以保持畫面上只有一個跑動的人物,但是因為畫面被緩存時,像素已經被覆蓋掉了,如果把人物擦掉,只從緩存的數據中,是無法知道被擦掉的這部分像素點應該被修複成什麼樣子的,例如下圖中,緩存中是上一幀的數據複原後的圖,但是如果下一幀人物離開了原位置,原來的畫面就無法利用緩存直接恢復了,例如上圖中紅框中的部分就留下了人物的殘影。
假設在上面的畫面中,人物的大小是100*100
,緩存的像素中,其位置是(200,400)
,假設一幀中它平移了10
個像素,那麼就可以粗略地認為需要更新的區域是左上角為(200,400)
,寬110
,高100
的矩形區域。儘管這個110*100
的矩形區域可能只占了整個緩存區域的10%
,也就是大部分緩存的像素點還是有效的,但為了修複這部分畫面,程式將不得不重新計算每個對象的繪製結果,然後將這個區域的畫面按照層次重新繪製上去,在上面的示例中,變更區擦除後從下到上依次要繪製天空、山和人物,人物是繪製在最上層的以便可以完整顯示,人物離開後的空白像素也在重繪中被修複。
分層繪製
單幅點陣圖像素緩存的劣勢其實已經很明顯了,下麵再來看看分層的情況,假如上述畫面中的對象分別繪製在不同的canvas
畫布上,那麼一共就需要5個canvas
元素,由於畫布是透明底色的,所以最終顯示結果是疊加而成的。接著為每個canvas
層都生成像素數據的緩存,那麼在面對同樣的更新場景時,天空、地面、山和雲都可以不用操作,而只需要更新人物所在的canvas
層,先將受影響的區域擦除,接著重新計算人物的繪製結果並更新單層的緩存,最後將新的結果繪製到目標位置上,相比之下,分層緩存的方案使用了更多的存儲空間來緩存繪製的像素數據,但減少了更新時的計算量,是典型的空間換時間的做法。
層的合併
顯示器上最終呈現的是一幅點陣圖畫面,所以即使在上面的示例中使用了5個分佈在不同層次的canvas
標簽,實際上電腦在處理時仍然會對各層的像素數據按層進行合併計算。上面的示例中存在一個很容易發現的優化點,就是無論怎麼重繪,實際上山
和地面
的繪製結果都會擋住對應區域的天空
的繪製結果,而且它們都是靜態的,所以天空
的緩存數據中,與山
和地面
重疊的部分實際上沒什麼用,如果更新的區域發生在重疊區,那麼更新畫面的時候,天空
層總是要先繪製一次然後再被更高層的山
或者地面
覆蓋掉,這時候就可以利用層合併的思想進行優化,也就是直接將天空,山和地面繪製在同個canvas
上,它們整體的繪製結果緩存時只需要占用原來1/3的空間(3張點陣圖變1張了),但對於後續的重繪卻不會造成影響,這樣就可以省掉很大一部分確定沒有用的緩存。當然上面的示例只是比較簡單的情況,在DOM節點渲染結果的處理時有更加複雜的層劃分和層合併的規則,但是優化的思想基本是一樣的。
五.小結
從直接繪製到分層繪製再到層的合併的過程,實際上就是從DOM節點到RenderObject樹
再到RenderLayer樹
的變換過程,利用canvas
的實例就比較容易理解軟體渲染過程中的一些策略了,很多東西你覺得不理解,並不一定是因為它本身有多複雜,只是因為你無法知道它是為瞭解決什麼問題而存在的,實際上當你面對同樣的問題時,可能也會採取類似甚至更好的處理策略,但當我們只看別人描述解決方案時,通常都會感覺到一個東西“特別複雜”或者“特別高大上”,所以請永遠保持謙遜,但也別丟了你的自信。最後分享一個最近很喜歡的冷段子,下一期再見。
問:"從前有一隻菜鳥,他特別菜,但是他仍然在飛,請問為什麼?"
答:“因為他有一顆勇敢的心!”