Druid入門(1)—— 快速入門實時分析利器-Druid_0.17

来源:https://www.cnblogs.com/tree1123/archive/2020/02/10/12289827.html
-Advertisement-
Play Games

一、安裝準備 本次安裝的版本是截止2020.1.30最新的版本0.17.0 軟體要求 需要 Java 8(8u92 +) 以上的版本,否則會有問題 Linux,Mac OS X或其他類似Unix的操作系統(不支持Windows) 硬體要求 Druid包括一組參考配置和用於單機部署的啟動腳本: 單服務 ...


一、安裝準備

本次安裝的版本是截止2020.1.30最新的版本0.17.0

軟體要求

  • 需要Java 8(8u92 +)以上的版本,否則會有問題

  • Linux,Mac OS X或其他類似Unix的操作系統(不支持Windows)

硬體要求

Druid包括一組參考配置和用於單機部署的啟動腳本:

  • nano-quickstart
  • micro-quickstart
  • small
  • medium
  • large
  • xlarge

單伺服器參考配置

Nano-Quickstart:1個CPU,4GB RAM
  • 啟動命令: bin/start-nano-quickstart
  • 配置目錄: conf/druid/single-server/nano-quickstart
微型快速入門:4個CPU,16GB RAM
  • 啟動命令: bin/start-micro-quickstart
  • 配置目錄: conf/druid/single-server/micro-quickstart
小型:8 CPU,64GB RAM(〜i3.2xlarge)
  • 啟動命令: bin/start-small
  • 配置目錄: conf/druid/single-server/small
中:16 CPU,128GB RAM(〜i3.4xlarge)
  • 啟動命令: bin/start-medium
  • 配置目錄: conf/druid/single-server/medium
大型:32 CPU,256GB RAM(〜i3.8xlarge)
  • 啟動命令: bin/start-large
  • 配置目錄: conf/druid/single-server/large
大型X:64 CPU,512GB RAM(〜i3.16xlarge)
  • 啟動命令: bin/start-xlarge

  • 配置目錄: conf/druid/single-server/xlarge

我們這裡做測試使用選擇最低配置即可nano-quickstart

二、下載安裝包

訪問官網:

http://druid.io/現在也會跳轉https://druid.apache.org/

或者直接訪問https://druid.apache.org/

file

點擊download進入下載頁面:

file

選擇最新版本: apache-druid-0.17.0-bin.tar.gz 進行下載

200多M

file

也可以選擇下載源碼包 用maven進行編譯

三、安裝

上傳安裝包

在終端中運行以下命令來安裝Druid:

tar -xzf apache-druid-0.17.0-bin.tar.gz
cd apache-druid-0.17.0

安裝包里有這幾個目錄:

file

  • LICENSENOTICE文件
  • bin/* -腳本
  • conf/* -單伺服器和集群設置的示例配置
  • extensions/* -擴展
  • hadoop-dependencies/* -Druid Hadoop依賴
  • lib/* -Druid庫
  • quickstart/* -快速入門教程的配置文件,樣本數據和其他文件

配置文件

#進入我們要啟動的配置文件位置:
cd conf/druid/single-server/nano-quickstart/

file

_common 公共配置

file

是druid一些基本的配置,比如元資料庫地址 各種路徑等等

其他的是各個節點的配置

比較類似,比如broker

cd broker/

file

jvm配置

main配置

runtime運行時相關的配置

回到主目錄

啟動的conf在

cd conf/supervise/single-server

file

裡面是不同配置啟動不同的腳本

四、啟動

回到主目錄

./bin/start-nano-quickstart

啟動成功:

file

訪問

localhost:8888

看到管理頁面

file

如果要修改埠,需要修改配置的埠和主目錄下的

vi bin/verify-default-ports 

五、載入數據

Druid提供了一個示例數據文件,其中包含2015年9月12日發生的Wiki的示例數據。

此樣本數據位於quickstart/tutorial/wikiticker-2015-09-12-sampled.json.gz

示例數據大概是這樣:

{
  "timestamp":"2015-09-12T20:03:45.018Z",
  "channel":"#en.wikipedia",
  "namespace":"Main",
  "page":"Spider-Man's powers and equipment",
  "user":"foobar",
  "comment":"/* Artificial web-shooters */",
  "cityName":"New York",
  "regionName":"New York",
  "regionIsoCode":"NY",
  "countryName":"United States",
  "countryIsoCode":"US",
  "isAnonymous":false,
  "isNew":false,
  "isMinor":false,
  "isRobot":false,
  "isUnpatrolled":false,
  "added":99,
  "delta":99,
  "deleted":0,
}

Druid載入數據分為以下幾種:

  • 載入文件
  • 從kafka中載入數據
  • 從hadoop中載入數據
  • 自定義載入方式

我們這樣演示一下載入示例文件數據

1、進入localhost:8888 點擊load data

file

2、選擇local disk

file

3、選擇Connect data

file

4、預覽數據

Base directory輸入quickstart/tutorial/

File filter輸入 wikiticker-2015-09-12-sampled.json.gz

然後點擊apply預覽 就可以看見數據了 點擊Next:parse data解析數據

file

5、解析數據

可以看到json數據已經被解析了 繼續解析時間

file

6、解析時間

解析時間成功 之後兩步是transform和filter 這裡不做演示了 直接next

file

7、確認Schema

這一步會讓我們確認Schema 可以做一些修改

由於數據量較小 我們直接關掉Rollup 直接下一步

file

8、設置分段

這裡可以設置數據分段 我們選擇hour next

file

9、確認發佈

file

file

10、發佈成功 開始解析數據

file

等待任務成功

file

11、查看數據

選擇datasources 可以看到我們載入的數據

可以看到數據源名稱 Fully是完全可用 還有大小等各種信息

file

12、查詢數據

點擊query按鈕

我們可以寫sql查詢數據了 還可以將數據下載

file

Druid相關博文

什麼是Druid

靜下心來,努力的提升自己,永遠都沒有錯。更多實時計算相關博文,歡迎關註實時流式計算

file


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • Canary 參考鏈接:https://ctf wiki.github.io/ctf wiki/pwn/linux/mitigation/canary zh/ 0x1 簡介: 用於防止棧溢出被利用的一種方法,原理是在棧的ebp下麵放一個隨機數,在函數返回之前會檢查這個數有沒有被修改,就可以檢測是否發 ...
  • 目的: 瞭解linux的啟動過程 主要內容: 1.grub 是啟動程式的bootloader 2.linux kernel 是linux的開源內核 3.busybox 是linux的工具集合 啟動順序: grub bzimage initrd init chroot sbin/init (從記憶體鏡像 ...
  • 問題描述 公司項目測試環境調用某些介面的時候,伺服器立即崩潰,並一定時間內無法提供服務。 問題排查 伺服器配置不夠 第一反應是伺服器需要升配啦,花錢解決一切!畢竟測試伺服器配置確實不高,2CPU + 4Gib,能幹啥?不過問題是今天突然發生的,而且說崩就崩。憑著嚴謹的態度,還是要刨根問底地找下問題。 ...
  • Ubuntu16.04安裝MongoDB指南 系統初始化 安裝mongodb mongodb預設是監聽在127.0.0.1埠的,要開啟外網連接,需要修改mongodb配置文件: 修改為 連接mongodb 使用工具 "robo 3t" ,添加連接信息 啟用密碼訪問 mongodb預設是不開啟密碼登 ...
  • 全量遷移 備份數據 正式遷移 首先要修改備份文件 .sql的owner,防止許可權出現錯誤。 【註意點】該遷移操作會覆蓋原來的資料庫,所以最好創建一個新庫。 列出所有表名和資料庫名 PostgreSQL 中 有時候想刪除資料庫(drop database swiftliveqaapi;),發現提示“E ...
  • 1.先開啟binlog log-bin = /var/log/mysql/mysql_bin #binlog日誌文件,以mysql_bin開頭,六個數字結尾的文件:mysql_bin.000001,並且會將文件存儲在相應的xxx/xxx路徑下,如果只配置mysql_bin的話預設在C:\Progra ...
  • 1 update T_META_OBJECTTYPE set FSUPPLIERNAME ='PAEZ',FPACKAGEID =null ...
  • 重點參考: "MySQL索引原理及慢查詢優化 (美團技術分享網站)" :原理、示例優化都寫的很好。 "索引很難麽?帶你從頭到尾捋一遍MySQL索引結構,不信你學不會!" :原理寫的很好。 "【從入門到入土】令人脫髮的資料庫底層設計" :很詳細的底層原理 一定要仔細看其中講的索引原理!!!本文中都是簡 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...