大數據培訓課程：Hive配置總結

-Advertisement-

# 配置相關 0. 配置存儲在$HOME目錄下的.hiverc文件中 1. 在提示符中顯示資料庫名 set hive.cli.print.current.db=true; 2. 優先使用本地模式執行 set hive.exec.mode.loacl.auto=true; 3. 列印列名 set h ...

# ------------------配置相關--------------------------

0. 配置存儲

在$HOME目錄下的.hiverc文件中

1. 在提示符中顯示資料庫名

set hive.cli.print.current.db=true;

2. 優先使用本地模式執行

set hive.exec.mode.loacl.auto=true;

3. 列印列名

set hive.cli.print.header=true;

4. （非）嚴格模式

set hive.mapred.mode=strict;

set hive.mapred.mode=nonstrict;

5. 開啟動態分區

set hive.exec.dynamic.partition=true;

# --------------動態分區調整--------------------

-- 設置動態分區模式

set hive.exec.dynamic.partition.mode=strict

-- 設置總的動態分區個數

set hive.exec.max.dynamic.partitions=300000

-- 設置每個節點上動態分區個數

set hive.exec.max.dynamic.partitions.pernode=10000

9. 設置全局可以產生文件的個數

set hive.exec.max.created.files=100000;

10.開啟map site join

set hive.auto.convert.join=true;

11.設置小表大小（位元組）

set hive.mapjoin.smalltable.filesize=25000000

12.強制將數據按照桶結構定義來插入數據

set hive.enforce.bucketing=true

13.limit優化

-- 啟用limit優化

set hive.limit.optimize.enable=true;

-- 限制從最大多少條數據中進行limit

set hive.limit.row.max.size=10000;

-- 限制最多遍歷的文件個數

set hive.limit.optimize.limit.file=10;

14. 壓縮

--開啟中間壓縮（即map到reduce之間的數據壓縮）

set hive.exec.compress.intermediate=true;

-- 開啟hadoop中間壓縮（即map到reduce之間的數據壓縮）

set mapred.compress.map.output=true;

-- 開啟hive最終壓縮（即reduce輸出的數據壓縮）

set hive.exec.compress.output=true;

4. 數據倉庫的存儲地址

hive-default.xml中，不一般不同

<name>hive.metastore.warehouse.dir</name>

<value>/user/hive/warehouse</value>

<description>location of default database for the warehouse</description>

</property>

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

如何在 Debian 9 下安裝 LEMP 和 WHMCS 7.5

WHMCS 7.5 發佈了，它開始支持 PHP 7.2，這裡就寫個簡單的教程記錄一下安裝方式。 1、準備工作首先，我們需要按照在Debian 9 / Debian 8 下使用源安裝方式安裝 LEMP 一文，安裝好 LEMP 環境，可以選一些需要用到的 PHP 7.2 軟體包： 2、安裝 ionC ...
[BlueZ] 1、Download install and use the BlueZ and hcitool on PI 3B+

星期日, 02. 九月 2018 11:58下午 beautifulzzzz ![][ bar] 1. Introduction Bluez is the default Bluetooth protocol stack on Linux. It should be present and inst ...
oracle中print_table存儲過程介紹

一直以來，覺得MySQL中使用\G參數改變輸出結果集的顯示方式非常好用，尤其是在命令行界面。但是ORACLE資料庫沒有這個功能，今天在搜索到Tom大師的一篇博文時，發現大師用一個存儲過程print_table實現了類似這樣的功能。只是我們這些凡夫俗子不知道而已，特意整理在此，方便自己或有需要的人以後... ...
SQL Server 2005詳細安裝過程及配置

說明：個人感覺SQL Server 2005是目前所有的SQL Server版本當中最好用的一個版本了，原因就是這個版本比起其它版本來說要安裝簡單，操作簡便，只可惜這個版本只能在Windows7或者低版本的操作系統裡面正常安裝和使用，在Windows8或者更高版本的系統裡面安裝了以後用不了（沒有SQ ...
DB2表被鎖，如何解鎖

原因與解決方案 1.原因：修改表結構表結構發生變化後再對錶進行任何操作都不被允許，SQLState為57016（因為表不活動，所以不能對其進行訪問），由於修改了表欄位許可權，導致表處於不可用狀態，另外一個小的建議，如果平時的工作中用到DB2的話，最好準備一份DB2錯誤文檔 2.解決方案：對錶進行重構， ...
SQLServer值DEFAULT約束

DEFAULT約束添加規則 1、若在表中定義了預設值約束，用戶在插入新的數據行時，如果該行沒有指定數據，那麼系統將預設值賦給該列，如果我們不設置預設值，系統預設為NULL。 2、如果“預設值”欄位中的項替換綁定的預設值（以不帶圓括弧的形式顯示），則將提示你解除對預設值的綁定，並將其替換為新的預設值。 ...
mysql 開發進階篇系列 35 工具篇 mysqldump(數據導出工具)

一.概述 mysqldump客戶端工具是用來備份資料庫或在不同資料庫之間進行數據遷移。備份內容包含創建表或裝載表的sql語句。mysqldump目前是mysql中最常用的備份工具。三種方式來調用mysqldump，命令如下：上圖第一種是備份單個資料庫或者庫中部分數據表（從備份方式上，比sqlse ...
SQL Server 中的回滾

預設情況下如果執行一個事務中出現錯誤，則只回滾錯誤操作語句（就是說這句不執行了，算不上回滾），錯誤處之前或之後的正確操作語句還是會被提交。如：全部回滾的方法1：打開 XACT_ABORT 全部回滾方法2：使用Try...Catch 全部回滾方法3：自定義錯誤變數最後要註意的是：如果一個事務寫了 ...