YCSB測試HBase遠程完全分散式集群

来源:https://www.cnblogs.com/ivan-uno/archive/2018/03/28/8663215.html
-Advertisement-
Play Games

本文會著重介紹一下YCSB測試遠程完全分散式集群的操作差異。雖然網上有很多介紹YCSB測試HBase的文章,但都是針對本地HBase偽分散式集群的。大家都知道,稍微正式一些的壓測都會要求測試客戶端與目標集群分離部署,而且偽分散式集群通常不會在生產環境下使用,本身也沒有太大的壓測意義。 ...


寫在前面

本文只講一個很簡單的問題,YCSB對HBase集群的測試。雖然網上有很多介紹YCSB測試HBase的文章,但都是針對本地HBase偽分散式集群的。大家都知道,稍微正式一些的壓測都會要求測試客戶端與目標集群分離部署,而且偽分散式集群通常不會在生產環境下使用,本身也沒有太大的壓測意義。本文會著重介紹一下壓測遠程HBase完全分散式集群的不同之處。

正文

YCSB是Yahoo開源的性能測試工具,支持很多種類的NoSQL資料庫測試,這裡既包括了經典的HBase/Cassandra/MongoDB,也有近兩年新推出的Spanner/Kudu等。此外,YCSB最大的特點是其靈活性,對於尚未納入官方支持的NoSQL資料庫,可以快速進行二次開發。如果你正在進行NoSQL資料庫選型或者研發一款定製版Nosql資料庫,那麼YCSB一定是你居家旅行必備良藥。

二次開發工作主要是com.yahoo.ycsb.DB的基礎上定義自己的介面實現。DB是一個抽象類,定義了NoSQL資料庫的5類典型操作,包括insert/update/delete/read/scan。你需要為自己的Nosql實現該上述方法。當然還有一些初始化(init)和收尾工作(cleanup)也要有相應的處理。

HBase是YCSB較早支持的NoSQL資料庫,目前在主線版本上支持0.98/1.0/1.2/1.4/2.0幾個版本(後兩個版本是在2018-03-23增加的)。這些版本的主要差別在於對DB類的不同實現,閱讀源碼可以發現,在1.0版本後,DB的實現類並沒有發生變化,1.2/1.4/2.0三個版本都是直接繼承了1.0版,沒有重載任何方法。從這點上來說,Ivan認為使用其中哪個版本測試應該都是OK的。

使用YCSB進行HBase完全分散式集群測試,主要是以下幾個步驟。

1、搭建HBase分散式集群

Ivan的HBase版本為1.2.6,部署HBase集群具體步驟略去。

2、下載YCSB版本

Ivan選擇的是YCSB0.13版本,如果使用master應該也是OK的,前文已經說過,這兩個版本中HBase的訪問介面是一樣的。

wget https://github.com/brianfrankcooper/YCSB/archive/0.13.0-staging.zip
3、編譯YCSB

執行進行編譯。

mvn clean package

由於YCSB支持了很多NoSQL資料庫,所以在編譯時依賴的Jar包也比較多。Ivan嘗試了幾次編譯,都由於下載依賴包超時失敗,尤其是在cassandra部分。看了下maven的輸出信息,超時的部分都是測試相關的。所以調整命令如下

mvn clean package -Dmaven.test.skip=true

編譯順利完成。

4、添加HBase配置

本文的重點來了!!!很多人容易犯暈的地方。

事實上,如果YCSB與HBase偽分散式集群合併部署時,這部分的配置是可以忽略的。YCSB通過上下文全局變數可以直接得到HBase的信息,實現壓測。可能這就是網上很多文章並不去介紹配置的原因。

我們還是從YCSB官方文檔找答案,在0.94/0.98/1.0三個版本中給出的配置方式完全不同,仔細閱讀發現1.0版本實際上是特別針對Google BigTable的配置文件。這由於BigTable提供了對HBase的相容API,YCSB將其作為一種NoSQL雲服務也納入了進來。但是此處的配置沒有參考意義。在1.2版本中,雖然介面代碼繼承自1.0版本,但readme中明確提到配置文件要參考0.98版本,後續1.4/2.0的readme基本是照抄。

閱讀0.98版本的readme,發現其實設置非常簡單,我們只需要將HBase集群master節點下的hbase-site.xml文件拷貝到YCSB節點的某個位置,併在稍後的命令中指定即可。
網上有的文章會提到其他配置甚至腳步文件,這裡Ivan明確的說,只需要hbase-site.xml,不需要其他文件!!!

Ivan的hbase-site.xml文件內容如下。

<configuration>
<property>
<name>hbase.rootdir</name>
<value>hdfs://master:9000/hbase</value>
</property>
<property>
<name>hbase.zookeeper.quorum</name>
<value>master,slave1,slave2</value>
</property>
<property>
<name>hbase.cluster.distributed</name>
<value>true</value>
</property>
<property>
<name>hbase.zookeeper.property.dataDir</name>
<value>/usr/bigdata/zookeeper-3.4.11/zkData</value>
</property>
</configuration>

事實上,YCSB主要是從中讀取zookeeper的節點信息。

Ivan將hbase-site.xml拷貝到/home/ycsb-hbase/conf(也可根據你的環境定義其他路徑)目錄下

所以相應的,請修改YCSB本地的hosts文件,將機器名與IP的對應關係維護進去。

5、創建目標表

創建usertable表,這個是YCSB測試的前置條件,測試腳本中不會自動創建

create 'usertable','family'
6、執行測試命令

最後一步,只需要在命令行中增加 -cp 參數指定hbase-site.xml的路徑即可。
例如以下命令。

1)載入數據

bin/ycsb load hbase10 -P workloads/workloada -cp /home/ycsb-hbase/conf -p table=usertable -p columnfamily=family -threads 100

2)執行scan測試

bin/ycsb run hbase10 -P workloads/workloade -cp /home/ycsb-hbase/conf -p table=usertable -p columnfamily=family -threads 100

打完收工。

最後啰嗦一句,YCSB測試HBase完全分散式集群的主要差異在於配置文件,即hbase-site.xml和修改本地hosts文件,目的是為了連接zookeeper集群。

更多YCSB介紹與測試命令可參考前文 NoSQL性能測試工具YCSB-Running a Workload


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 先講下事務執行流程: BEGIN和COMMIT 結果: ROLLBACK 結果: 由上可知BEGIN TRAN 開始事務,使事務數量加一 COMMIT TRAN 使事務減一,提交最新開闢的事務 ROLLBACK 使事務數量直接減為0,也就是回滾 事務分類: 1.顯示事務 2.隱式事務模式 3.自動提 ...
  • 40、子查詢:出現在其他SQL語句里的SELECT語句 例如:SELECT sname,mark FROM student WHERE mark = (SELECT max(mark) FROM student); SELECT sname,mark FROM student WHERE mark ...
  • #求最高工資的員工信息 SELECT * FROM emp WHERE sal = (SELECT max(sal) FROM emp); #刪除工資最低的員工信息 DELETE FROM emp WHERE sal = (SELECT e.s FROM (SELECT min(sal) s FRO ...
  • 17、創建表 CREATE TABLE tbname(columnname1 類型 約束條件, columnname2 類型 約束條件,…); 三大類型:數值型,時間日期型,字元串類型 六大約束條件: PRIMARY KEY(主鍵) NOT NULL(非空) AUTO_INCREMENT(自增長) ...
  • 案例 案例:Laravel 在文章列表中附帶上前10條評論?,在獲取文章列表時同時把每個文章的前10條評論一同查詢出來。 這是典型分區查詢案例,需要根據 comments 表中的 post_id 欄位進行分區,同時根據條件進行排序,把符合條件的前 N 條是數據取出來。 在其他資料庫(Oracle,  ...
  • 1、啟動/關閉伺服器 第一種方法:通過Notifier 第二種方法: 通過Windows自帶的服務管理:電腦右鍵選擇管理彈出框選擇“服務和應用程式”里的服務列表,從列表中找到MySQL服務,進行啟動和關閉 第三種方法 net start 伺服器名稱(mysql57) net stop 伺服器名稱 ...
  • 之前有個同學問我,本地資料庫插入新數據時怎麼同步到伺服器上,當時我先想到是程式邏輯控制,作相應的處理。 但有時候我們程式不太好處理,那能不能從資料庫入手呢,資料庫不是有觸發器(Trigger)嗎,應該是可以的,這裡就用這個來做吧。一些東西也是不太懂,網上找的資料,感謝那些人默默奉獻的好人。如有誤解, ...
  • /* author simon */ 例:資料庫:NCDB2用戶 :DB2ADMIN/DB2ADMIN備份庫路徑:D:/bank 一.恢複數據庫1.啟動資料庫運行-》db2cmd-》db2Db2=>start db managerDb2=>force application allDb2=>drop ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...