一、Hadoop HA的Web頁面訪問 Hadoop開啟HA後,會同時存在兩個Master組件提供服務,其中正在使用的組件稱為Active,另一個作為備份稱為Standby,例如HDFS的NameNode、YARN 的ResourceManager。HDFS的web頁面只有通過Active的Name ...
一、Hadoop HA的Web頁面訪問
Hadoop開啟HA後,會同時存在兩個Master組件提供服務,其中正在使用的組件稱為Active,另一個作為備份稱為Standby,例如HDFS的NameNode、YARN 的ResourceManager。HDFS的web頁面只有通過Active的NameNode才能正常訪問,同樣地,YARN的web頁面也只有通過Active的ResouceManager才能正常訪問。
(1) HDFS HA的Web訪問
正常使用Nginx的proxy_pass代理單一的Web服務地址時非常簡單(參考博文最簡反向代理配置),而面對Hadoop HA這樣的多Web服務地址時就會有點麻煩。
(2) HDFS HA的Web代理
雖然Nginx的upstream支持配置多個Web地址,預設會隨機將Web請求隨機轉發到任意一個Web地址,只有某個web地址被認為不可達後,才會被Nginx列入黑名單。而Hadoop HA的Active和Standby節點都是一直服務的,只是同一個時刻,最多只有一個節點的Web訪問是有效的,這就要求Nginx對upstream中的Web地址更細緻地檢查,而非粗略地判斷是否可達。
二、Nginx的upstream健康檢查
對upstream的地址有效性檢查稱為健康檢查。通過定期的調用檢查邏輯,對upstream配置的Web地址進行標記,不健康的Web地址會被臨時列入黑名單內,直到該地址被標記為健康狀態時,才會有新的Web請求轉發到該地址上。
(1)Nginx本身對upstream的健康檢查支持並不強大,做不到對檢查邏輯的自由定製。
(2)開源項目nginx_upstream_check_module以Nginx補丁的方式擴展了Nginx的upstream語法,支持自定義HTTP請求的方式檢查Web服務的健康狀態。但在實際使用過程中,遇到一個很不方便的地方。
upstream resourcemanagers { server 192.168.0.1:8084; server 192.168.0.2:8084; check interval=30000 rise=1 fall=3 timeout=5000 type=http; check_http_send "HEAD / HTTP/1.0\r\n\r\n"; check_http_expect_alive http_3xx; keepalive 2000; }
nginx_upstream_check_module使用check命令定義健康檢查的基本屬性,使用check_http_send自定義HTTP請求,check_http_expect_alive定義期望的健康狀態HTTP code。這裡使用http_3xx是該模塊定義的內置匹配語法,表示以3開頭的HTTP code。想必大家已經想到,這種定義方式是無法精確區分301、302、307報文的。當然正常情況下,3xx的報文應該是同類型的報文,不需要如此精確的區分,但是不巧的是Hadoop2.7.2版本的Active ResourceManager和Standby ResourceManager分別返回的是302和307報文!
(3)以上兩種方案並不是解決Nginx upstream健康檢查的完美方案,真正完美的方案是OpenResty的lua-resty-upstream-healthcheck。OpenResty內置了大量的Lua庫,可以自由擴展、定製Nginx的功能。其中healthcheck.lua模塊用於upstream的健康檢查。
不過我希望在Nginx的基礎上只擴展upstream健康檢查的功能,而非用OpenResty代替Nginx,因此需要使用Nginx的lua-upstream-nginx-module模塊。
三、編譯安裝擴展Nginx
(1)由於lua-upstream-nginx-module是使用Lua腳本對Nginx進行擴展,因此必須安裝Lua解釋器。LuaJIT是Lua語言的即時編譯器,效率更高。
$ wget http://luajit.org/download/LuaJIT-2.0.4.tar.gz $ tar zxvf LuaJIT-2.0.4.tar.gz $ cd LuaJIT-2.0.4 $ make $ make install $ export LUAJIT_LIB=/usr/local/lib $ export LUAJIT_INC=/usr/local/include/luajit-2.0 $ rm /usr/local/lib/libluajit-5.1.so* $ cd ..
導出環境變數LUAJIT_LIB和LUAJIT_INC是為了後續編譯lua-nginx-module模塊使用。刪除libluajit的所有動態鏈接庫是為了保證後續編譯時是靜態鏈接,否則預設為動態鏈接。
(2)準備好Lua環境後,接下來下載Nginx的Lua模塊lua-nginx-module、Nginx開發包ngx_devel_kit、Nginx upstreamLua模塊lua-upstream-nginx-module、pcre庫和openssl庫、Nginx源碼。解壓後的文件列表如下:
./lua-nginx-module-0.10.5 ./lua-upstream-nginx-module-0.05 ./nginx-1.10.1 ./ngx_devel_kit-0.3.0 ./openssl-OpenSSL_1_0_1t ./pcre-8.38
執行命令編譯Nginx:
$ cd nginx-1.10.1 $ ./configure --prefix=/etc/nginx --sbin-path=/usr/sbin/nginx --conf-path=/etc/nginx/nginx.conf --error-log-path=/var/log/nginx/error.log --http-log-path=/var/log/nginx/access.log --pid-path=/var/run/nginx.pid --lock-path=/var/run/nginx.lock --http-client-body-temp-path=/var/cache/nginx/client_temp --http-proxy-temp-path=/var/cache/nginx/proxy_temp --http-fastcgi-temp-path=/var/cache/nginx/fastcgi_temp --http-uwsgi-temp-path=/var/cache/nginx/uwsgi_temp --http-scgi-temp-path=/var/cache/nginx/scgi_temp --user=root --group=root --with-http_ssl_module --with-http_realip_module --with-http_addition_module --with-http_sub_module --with-http_dav_module --with-http_flv_module --with-http_mp4_module --with-http_gunzip_module --with-http_gzip_static_module --with-http_random_index_module --with-http_secure_link_module --with-http_stub_status_module --with-http_auth_request_module --with-threads --with-stream --with-stream_ssl_module --with-http_slice_module --with-mail --with-mail_ssl_module --with-file-aio --with-ipv6 --with-http_v2_module --with-http_v2_module --with-cc-opt='-O2 -g -pipe -Wall -Wp,-D_FORTIFY_SOURCE=2 -fexceptions -fstack-protector --param=ssp-buffer-size=4 -m64 -mtune=generic' --with-pcre=../pcre-8.38 --with-openssl=../openssl-OpenSSL_1_0_1t --add-module=../ngx_devel_kit-0.3.0 --add-module=../lua-nginx-module-0.10.5 --add-module=../lua-upstream-nginx-module-0.05 $ make && make install
(3) 安裝完畢後,Nginx的配置文件為/etc/nginx/nginx.conf,可執行文件為/usr/sbin/nginx。執行Nginx啟動命令:
$ nginx
訪問http://127.0.0.1:8080即可看到Nginx主頁。
(4) 添加Lua測試鏈接,測試Lua模塊是否正常工作。
location /lua { set $test "hello, world."; content_by_lua ' ngx.header.content_type = "text/plain"; ngx.say(ngx.var.test); '; }
更新Nginx配置:
$ nginx -s reload
訪問http://127.0.0.1:8080/lua即可看到”hello,world.”。
四、Nginx代理Hadoop HA
(3) Nginx代理Hadoop HA
雖然安裝了lua-upstream-nginx-module模塊,但是仍需要使用OpenResty的healthcheck.lua模塊才能完成upstream的健康檢查功能。
(1) 下載最新版本的OpenResty代碼。執行如下命令:
make && make install ls /usr/local/openresty/lualib/resty/upstream/healthcheck.lua
其中healthcheck.lua腳本就是我們需要的健康檢查模塊。
(2) 配置nginx.conf:
# upstream upstream resourcemanagers { server 192.168.0.1:8084; server 192.168.0.2:8084; keepalive 2000; } upstream namenodes { server 192.168.0.1:50070; server 192.168.0.2:50070; keepalive 2000; } # health check lua_package_path "/usr/local/openresty/lualib/?.lua;;"; lua_shared_dict healthcheck 1m; lua_socket_log_errors off; init_worker_by_lua_block { local hc = require "resty.upstream.healthcheck" local ok, err = hc.spawn_checker { shm = "healthcheck", upstream = "resourcemanagers ", type = "http", http_req = "GET / HTTP/1.0\r\n\r\n", interval = 2000, timeout = 5000, fall = 3, rise = 2, valid_statuses = {302}, concurrency = 1, } if not ok then ngx.log(ngx.ERR, "=======> failed to spawn RM health checker: ", err) return end local ok, err = hc.spawn_checker { shm = "healthcheck", upstream = "namenodes ", type = "http", http_req = "GET /webhdfs/v1/?op=LISTSTATUS HTTP/1.0\r\n\r\n", interval = 2000, timeout = 5000, fall = 3, rise = 2, valid_statuses = {200}, concurrency = 1, } if not ok then ngx.log(ngx.ERR, "=======> failed to spawn NameNode health checker: ", err) return end } # proxy location /yarn/ { proxy_pass http://resourcemanagers/; # some sub_filter, rewrite config } location /hdfs/ { proxy_pass http://namenodes/; # some sub_filter, rewrite config }
更新Nginx配置:
$ nginx -s reload
訪問http://127.0.0.1:8080/hdfs或http://127.0.0.1:8080/yarn即可看到HDFS或YARN的Web頁面。
五、總結
綜上,使用Lua擴展Nginx的功能十分強大,且十分容易定製,這也是OpenResty的功能如此強大的原因。雖然OpenResty已經提供了lua-resty-upstream-healthcheck模塊完成upstream的健康檢查功能,不過我們仍在社區版的Nginx上親自擴展了該功能。希望這篇文章能幫助大家快速的配置Nginx+Lua的環境,並方便地開發自己的Nginx擴展功能。