在Tez上優化Hive查詢無法採用一刀切的方法。查詢性能取決於數據的大小、文件類型、查詢設計和查詢模式。在性能測試過程中，應評估和驗證配置參數及任何SQL修改。建議在工作負載的性能測試過程中一次只進行一項更改，並最好在開發環境中評估調優更改的影響，然後再在生產環境中使用。 ...

在Tez上優化Hive查詢的指南

在Tez上優化Hive查詢的指南

在Tez上優化Hive查詢無法採用一刀切的方法。查詢性能取決於數據的大小、文件類型、查詢設計和查詢模式。在性能測試過程中，應評估和驗證配置參數及任何SQL修改。建議在工作負載的性能測試過程中一次只進行一項更改，並最好在開發環境中評估調優更改的影響，然後再在生產環境中使用。

這裡分享一些關於Tez上Hive查詢的基本故障排除和調優指南。

調優指南

不同的hive版本，不同執行引擎之間的調優行為有所差異，所以同一條sql可能會有不一樣的速度。

一般情況下，我們可以通過以下步驟有助於識別可能導致性能下降的地方。

驗證和確認YARN容量調度器配置

隊列配置錯誤可能會由於對用戶可用資源的任意限制而影響查詢性能。驗證用戶限制因數、最小用戶限制百分比和最大容量。

檢查Hive和HiveServer2配置中的任何安全閥（非預設值）是否相關

移除任何遺留的和過時的屬性。

識別緩慢的區域，例如mapper任務、reducer任務和連接操作

審查Tez引擎和平臺的通用調優屬性。
審查mapper任務並根據需要增加/減少任務數。
審查reducer任務並根據需要增加/減少任務數。
審查任何併發相關的問題——併發問題分為兩種，如下所述：
- 隊列內用戶間的併發。這可以通過調整YARN隊列的用戶限制因數進行調優（詳細信息參考容量調度器博客）。
- Hive on Tez會話的預熱容器之間的併發，詳見下文。

理解Tez中的並行化

在更改任何配置之前，必須瞭解Tez內部的工作機制。例如，這包括瞭解Tez如何確定正確的mapper和reducer數量。審查Tez架構設計以及有關初始任務並行性和自動reducer並行性的詳細信息將有助於優化查詢性能。

理解mapper數量

Tez使用作業的初始輸入數據確定mapper任務的數量。在Tez中，任務數量由分組拆分決定，這相當於MapReduce作業中輸入拆分確定的mapper數量。

tez.grouping.min-size 和 tez.grouping.max-size 決定mapper的數量。min-size的預設值為16 MB，max-size為1 GB。
Tez確定任務數量，使每個任務的數據量符合最大/最小分組大小。
減少 tez.grouping.max-size 會增加任務/mapper數量。
增加 tez.grouping.max-size 會減少任務數量。

例如：

輸入數據（輸入碎片/拆分） – 1000個文件（約1.5 MB大小）
總數據量約為 – 1000*1.5 MB = ~1.5 GB
Tez可能嘗試使用至少兩個任務處理這些數據，因為每個任務的最大數據量可能為1 GB。最終，Tez可能強制將1000個文件（拆分）組合到兩個任務中，導致執行時間變慢。
如果將 tez.grouping.max-size 從1 GB減少到100 MB，mapper數量可能增加到15，從而提供更好的並行性。性能因此提高，因為改進的並行性將工作分散到15個併發任務中。

以上是一個示例場景，然而在生產環境中使用ORC或Parquet等二進位文件格式時，根據存儲類型、拆分策略文件或HDFS塊邊界確定mapper數量可能會變得複雜。

註意：更高程度的並行性（如mapper/reducer數量多）並不總是意味著更好的性能，因為它可能導致每個任務的資源減少以及由於任務開銷而導致的資源浪費。

理解reducer數量

Tez使用多種機制和設置確定完成查詢所需的reducer數量。

Tez根據要處理的數據（位元組數）自動確定reducer。
如果 hive.tez.auto.reducer.parallelism 設置為true，Hive會估算數據大小並設置並行性估算值。Tez將在運行時採樣源頂點的輸出大小並根據需要調整估算值。
預設情況下，最大reducer數量設置為1009（hive.exec.reducers.max）。
Hive/Tez使用以下公式估算reducer數量，然後調度Tez DAG：

Max(1, Min(hive.exec.reducers.max [1009], ReducerStage estimate/hive.exec.reducers.bytes.per.reducer)) x hive.tez.max.partition.factor [2]

以下三個參數可以調整以增加或減少mapper數量：

hive.exec.reducers.bytes.per.reducer：每個reducer的大小。更改為較小值以增加並行性，或更改為較大值以減少並行性。預設值為256 MB（即如果輸入大小為1 GB，則使用4個reducer）。
tez.min.partition.factor：預設值為0.25。
tez.max.partition.factor：預設值為2.0。增加以增加reducer數量，減少以減少reducer數量。

用戶可以使用 mapred.reduce.tasks 手動設置reducer數量。這不推薦使用，應避免使用。

建議：

避免手動設置reducer數量。
增加reducer數量並不總是能保證更好的性能。
根據reducer階段估算，如果要增加或減少reducer數量，可以調整 hive.exec.reducers.bytes.per.reducer 參數到較小或較大值。

併發

我們需要理解和調整Tez上的Hive併發會話，如運行多個Tez AM容器。以下屬性有助於理解預設隊列和會話數量行為。

hive.server2.tez.default.queues：與YARN隊列對應的以逗號分隔的值列表，用於維護Tez會話池。
hive.server2.tez.sessions.per.default.queue：每個YARN隊列中保持在池中的Tez會話（DAGAppMaster）數量。
hive.server2.tez.initialize.default.sessions：如果啟用，HiveServer2（HS2）在啟動時將啟動所有必要的Tez會話以滿足 sessions.per.default.queue 要求。

當定義以下屬性時，HiveServer2將為每個預設隊列創建一個Tez Application Master（AM），乘以HiveServer2服務啟動時的會話數量。因此：

(Tez Sessions)total = HiveServer2instances x (default.queues) x (sessions.per.default.queue)

示例說明：

hive.server2.tez.default.queues= “queue1, queue2”
hive.server2.tez.sessions.per.default.queue=2
=>HiveServer2將創建4個Tez AM（queue1兩個，queue2兩個）。

註意：池中的Tez會話總是運行，即使在空閑集群上。

如果HiveServer2連續使用，這些Tez AM將繼續運行，但如果HS2空閑，這些Tez AM將根據 tez.session.am.dag.submit.timeout.secs 定義的超時被終止。

案例1：未指定隊列名稱

如果查詢未指定隊列名稱（tez.queue.name），則只會使用池中的Tez AM（如上所述初始化）。在這種情況下，HiveServer2將選擇一個空閑/可用的Tez AM（隊列名稱可能是隨機選擇的）。如果未指定隊列名稱，則查詢將保持在HiveServer2中的掛起狀態，直到池中有一個可用的預設Tez AM來處理查詢。在JDBC/ODBC客戶端或HiveServer2日誌文件中不會有任何消息。由於沒有消息生成，當查詢掛起時，用戶可能會認為JDBC/ODBC連接或HiveServer2已斷開，但實際上它在等待一個Tez AM執行查詢。

案例2：指定隊列名稱

如果查詢指定了隊列名稱，無論有多少初始化的Tez AM正在使用或空閑，HiveServer2都會為此連接創建一個新的Tez AM，並且查詢可以執行（如果隊列有可用資源）。

併發的指南/建議

對於不希望用戶限制在同一個Tez AM池中的用例或查詢，將 hive.server2.tez.initialize.default.sessions 設置為false。禁用此選項可以減少HiveServer2上的爭用並提高查詢性能。
此外，增加 hive.server2.tez.sessions.per.default.queue 的會話數量。
如果有需要為每組用戶提供單獨或專用Tez AM池的用例，需要為每組用戶提供專用的HiveServer2服務，每個服務具有相應的預設隊列名稱和會話數量，並要求每組用戶使用各自的HiveServer2。

容器復用和預熱容器

容器復用

這是一個優化，可以減少容器的啟動時間影響。通過設置 tez.am.container.reuse.enabled 為true來啟用此功能。這節省了與YARN交互的時間。還可以保持容器組活躍，快速旋轉容器，並跳過YARN隊列。

預熱容器

容器數量與將附加到每個Tez AM的YARN執行容器數量相關。即使Tez AM空閑（未執行查詢），每個AM也會保留相同數量的容器。在某些情況下，這可能會導致太多容器空閑且未釋放，因為這裡定義的容器將被Tez AM保留，即使它是空閑的。這些空閑容器將繼續占用YARN中的資源，其他應用程式可能會利用這些資源。

以下屬性用於配置預熱容器：

hive.prewarm.enabled
hive.prewarm.numcontainers

一般Tez調優參數

在處理Tez上Hive查詢的性能下降時，審查以下屬性作為一級檢查。您可能需要根據查詢和數據屬性設置或調整其中一些屬性。最好在開發和QA環境中評估配置屬性，然後根據結果將其推送到生產環境。

hive.cbo.enable
將此屬性設置為true啟用基於成本的優化（CBO）。CBO是Hive查詢處理引擎的一部分，由Apache Calcite提供支持。CBO通過檢查查詢中指定的表和條件生成有效的查詢計劃，最終減少查詢執行時間並提高資源利用率。
hive.auto.convert.join
將此屬性設置為true允許Hive根據輸入文件大小啟用將常見連接轉換為mapjoin的優化。
hive.auto.convert.join.noconditionaltask.size
您將希望在查詢中儘可能多地執行mapjoin。此大小配置使用戶可以控製表的大小以適應記憶體。該值表示可以轉換為適合記憶體的哈希表的表的大小總和。建議將其設置為 hive.tez.container.size 的1/3。
tez.runtime.io.sort.mb
輸出排序時的排序緩衝區大小。建議將其設置為 hive.tez.container.size 的40%，最大值為2 GB。通常不需要超過此最大值。
tez.runtime.unordered.output.buffer.size-mb
當輸出不需要排序時的記憶體。這是緩衝區的大小，如果不直接寫入磁碟。建議將其設置為 hive.tez.container.size 的10%。
hive.exec.parallel
此屬性啟用Hive查詢階段的並行執行。預設情況下，此屬性設置為false。將此屬性設置為true有助於並行化獨立的查詢階段，從而整體提高性能。
hive.vectorized.execution.enabled
矢量化查詢執行是Hive的一個功能，它大大減少了典型查詢操作（如掃描、過濾、聚合和連接）的CPU使用量。預設情況下，此屬性設置為false。將其設置為true。
hive.merge.tezfiles
預設情況下，此屬性設置為false。將此屬性設置為true會合併Tez文件。使用此屬性可能會根據數據大小或要合併的文件數量增加或減少查詢的執行時間。在使用此屬性之前，請在較低環境中評估查詢性能。
hive.merge.size.per.task
此屬性描述作業結束時合併文件的大小。
hive.merge.smallfiles.avgsize
當作業的平均輸出文件大小小於此數字時，Hive將啟動一個額外的map-reduce作業將輸出文件合併為更大的文件。預設情況下，此屬性設置為16 MB。