Druid入門(1)—— 快速入門實時分析利器-Druid_0.17

来源:https://www.cnblogs.com/tree1123/archive/2020/02/10/12289827.html
-Advertisement-
Play Games

一、安裝準備 本次安裝的版本是截止2020.1.30最新的版本0.17.0 軟體要求 需要 Java 8(8u92 +) 以上的版本,否則會有問題 Linux,Mac OS X或其他類似Unix的操作系統(不支持Windows) 硬體要求 Druid包括一組參考配置和用於單機部署的啟動腳本: 單服務 ...


一、安裝準備

本次安裝的版本是截止2020.1.30最新的版本0.17.0

軟體要求

  • 需要Java 8(8u92 +)以上的版本,否則會有問題

  • Linux,Mac OS X或其他類似Unix的操作系統(不支持Windows)

硬體要求

Druid包括一組參考配置和用於單機部署的啟動腳本:

  • nano-quickstart
  • micro-quickstart
  • small
  • medium
  • large
  • xlarge

單伺服器參考配置

Nano-Quickstart:1個CPU,4GB RAM
  • 啟動命令: bin/start-nano-quickstart
  • 配置目錄: conf/druid/single-server/nano-quickstart
微型快速入門:4個CPU,16GB RAM
  • 啟動命令: bin/start-micro-quickstart
  • 配置目錄: conf/druid/single-server/micro-quickstart
小型:8 CPU,64GB RAM(〜i3.2xlarge)
  • 啟動命令: bin/start-small
  • 配置目錄: conf/druid/single-server/small
中:16 CPU,128GB RAM(〜i3.4xlarge)
  • 啟動命令: bin/start-medium
  • 配置目錄: conf/druid/single-server/medium
大型:32 CPU,256GB RAM(〜i3.8xlarge)
  • 啟動命令: bin/start-large
  • 配置目錄: conf/druid/single-server/large
大型X:64 CPU,512GB RAM(〜i3.16xlarge)
  • 啟動命令: bin/start-xlarge

  • 配置目錄: conf/druid/single-server/xlarge

我們這裡做測試使用選擇最低配置即可nano-quickstart

二、下載安裝包

訪問官網:

http://druid.io/現在也會跳轉https://druid.apache.org/

或者直接訪問https://druid.apache.org/

file

點擊download進入下載頁面:

file

選擇最新版本: apache-druid-0.17.0-bin.tar.gz 進行下載

200多M

file

也可以選擇下載源碼包 用maven進行編譯

三、安裝

上傳安裝包

在終端中運行以下命令來安裝Druid:

tar -xzf apache-druid-0.17.0-bin.tar.gz
cd apache-druid-0.17.0

安裝包里有這幾個目錄:

file

  • LICENSENOTICE文件
  • bin/* -腳本
  • conf/* -單伺服器和集群設置的示例配置
  • extensions/* -擴展
  • hadoop-dependencies/* -Druid Hadoop依賴
  • lib/* -Druid庫
  • quickstart/* -快速入門教程的配置文件,樣本數據和其他文件

配置文件

#進入我們要啟動的配置文件位置:
cd conf/druid/single-server/nano-quickstart/

file

_common 公共配置

file

是druid一些基本的配置,比如元資料庫地址 各種路徑等等

其他的是各個節點的配置

比較類似,比如broker

cd broker/

file

jvm配置

main配置

runtime運行時相關的配置

回到主目錄

啟動的conf在

cd conf/supervise/single-server

file

裡面是不同配置啟動不同的腳本

四、啟動

回到主目錄

./bin/start-nano-quickstart

啟動成功:

file

訪問

localhost:8888

看到管理頁面

file

如果要修改埠,需要修改配置的埠和主目錄下的

vi bin/verify-default-ports 

五、載入數據

Druid提供了一個示例數據文件,其中包含2015年9月12日發生的Wiki的示例數據。

此樣本數據位於quickstart/tutorial/wikiticker-2015-09-12-sampled.json.gz

示例數據大概是這樣:

{
  "timestamp":"2015-09-12T20:03:45.018Z",
  "channel":"#en.wikipedia",
  "namespace":"Main",
  "page":"Spider-Man's powers and equipment",
  "user":"foobar",
  "comment":"/* Artificial web-shooters */",
  "cityName":"New York",
  "regionName":"New York",
  "regionIsoCode":"NY",
  "countryName":"United States",
  "countryIsoCode":"US",
  "isAnonymous":false,
  "isNew":false,
  "isMinor":false,
  "isRobot":false,
  "isUnpatrolled":false,
  "added":99,
  "delta":99,
  "deleted":0,
}

Druid載入數據分為以下幾種:

  • 載入文件
  • 從kafka中載入數據
  • 從hadoop中載入數據
  • 自定義載入方式

我們這樣演示一下載入示例文件數據

1、進入localhost:8888 點擊load data

file

2、選擇local disk

file

3、選擇Connect data

file

4、預覽數據

Base directory輸入quickstart/tutorial/

File filter輸入 wikiticker-2015-09-12-sampled.json.gz

然後點擊apply預覽 就可以看見數據了 點擊Next:parse data解析數據

file

5、解析數據

可以看到json數據已經被解析了 繼續解析時間

file

6、解析時間

解析時間成功 之後兩步是transform和filter 這裡不做演示了 直接next

file

7、確認Schema

這一步會讓我們確認Schema 可以做一些修改

由於數據量較小 我們直接關掉Rollup 直接下一步

file

8、設置分段

這裡可以設置數據分段 我們選擇hour next

file

9、確認發佈

file

file

10、發佈成功 開始解析數據

file

等待任務成功

file

11、查看數據

選擇datasources 可以看到我們載入的數據

可以看到數據源名稱 Fully是完全可用 還有大小等各種信息

file

12、查詢數據

點擊query按鈕

我們可以寫sql查詢數據了 還可以將數據下載

file

Druid相關博文

什麼是Druid

靜下心來,努力的提升自己,永遠都沒有錯。更多實時計算相關博文,歡迎關註實時流式計算

file


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • Canary 參考鏈接:https://ctf wiki.github.io/ctf wiki/pwn/linux/mitigation/canary zh/ 0x1 簡介: 用於防止棧溢出被利用的一種方法,原理是在棧的ebp下麵放一個隨機數,在函數返回之前會檢查這個數有沒有被修改,就可以檢測是否發 ...
  • 目的: 瞭解linux的啟動過程 主要內容: 1.grub 是啟動程式的bootloader 2.linux kernel 是linux的開源內核 3.busybox 是linux的工具集合 啟動順序: grub bzimage initrd init chroot sbin/init (從記憶體鏡像 ...
  • 問題描述 公司項目測試環境調用某些介面的時候,伺服器立即崩潰,並一定時間內無法提供服務。 問題排查 伺服器配置不夠 第一反應是伺服器需要升配啦,花錢解決一切!畢竟測試伺服器配置確實不高,2CPU + 4Gib,能幹啥?不過問題是今天突然發生的,而且說崩就崩。憑著嚴謹的態度,還是要刨根問底地找下問題。 ...
  • Ubuntu16.04安裝MongoDB指南 系統初始化 安裝mongodb mongodb預設是監聽在127.0.0.1埠的,要開啟外網連接,需要修改mongodb配置文件: 修改為 連接mongodb 使用工具 "robo 3t" ,添加連接信息 啟用密碼訪問 mongodb預設是不開啟密碼登 ...
  • 全量遷移 備份數據 正式遷移 首先要修改備份文件 .sql的owner,防止許可權出現錯誤。 【註意點】該遷移操作會覆蓋原來的資料庫,所以最好創建一個新庫。 列出所有表名和資料庫名 PostgreSQL 中 有時候想刪除資料庫(drop database swiftliveqaapi;),發現提示“E ...
  • 1.先開啟binlog log-bin = /var/log/mysql/mysql_bin #binlog日誌文件,以mysql_bin開頭,六個數字結尾的文件:mysql_bin.000001,並且會將文件存儲在相應的xxx/xxx路徑下,如果只配置mysql_bin的話預設在C:\Progra ...
  • 1 update T_META_OBJECTTYPE set FSUPPLIERNAME ='PAEZ',FPACKAGEID =null ...
  • 重點參考: "MySQL索引原理及慢查詢優化 (美團技術分享網站)" :原理、示例優化都寫的很好。 "索引很難麽?帶你從頭到尾捋一遍MySQL索引結構,不信你學不會!" :原理寫的很好。 "【從入門到入土】令人脫髮的資料庫底層設計" :很詳細的底層原理 一定要仔細看其中講的索引原理!!!本文中都是簡 ...
一周排行
    -Advertisement-
    Play Games
  • 概述:在C#中,++i和i++都是自增運算符,其中++i先增加值再返回,而i++先返回值再增加。應用場景根據需求選擇,首碼適合先增後用,尾碼適合先用後增。詳細示例提供清晰的代碼演示這兩者的操作時機和實際應用。 在C#中,++i 和 i++ 都是自增運算符,但它們在操作上有細微的差異,主要體現在操作的 ...
  • 上次發佈了:Taurus.MVC 性能壓力測試(ap 壓測 和 linux 下wrk 壓測):.NET Core 版本,今天計劃準備壓測一下 .NET 版本,來測試並記錄一下 Taurus.MVC 框架在 .NET 版本的性能,以便後續持續優化改進。 為了方便對比,本文章的電腦環境和測試思路,儘量和... ...
  • .NET WebAPI作為一種構建RESTful服務的強大工具,為開發者提供了便捷的方式來定義、處理HTTP請求並返迴響應。在設計API介面時,正確地接收和解析客戶端發送的數據至關重要。.NET WebAPI提供了一系列特性,如[FromRoute]、[FromQuery]和[FromBody],用 ...
  • 原因:我之所以想做這個項目,是因為在之前查找關於C#/WPF相關資料時,我發現講解圖像濾鏡的資源非常稀缺。此外,我註意到許多現有的開源庫主要基於CPU進行圖像渲染。這種方式在處理大量圖像時,會導致CPU的渲染負擔過重。因此,我將在下文中介紹如何通過GPU渲染來有效實現圖像的各種濾鏡效果。 生成的效果 ...
  • 引言 上一章我們介紹了在xUnit單元測試中用xUnit.DependencyInject來使用依賴註入,上一章我們的Sample.Repository倉儲層有一個批量註入的介面沒有做單元測試,今天用這個示例來演示一下如何用Bogus創建模擬數據 ,和 EFCore 的種子數據生成 Bogus 的優 ...
  • 一、前言 在自己的項目中,涉及到實時心率曲線的繪製,項目上的曲線繪製,一般很難找到能直接用的第三方庫,而且有些還是定製化的功能,所以還是自己繪製比較方便。很多人一聽到自己畫就害怕,感覺很難,今天就分享一個完整的實時心率數據繪製心率曲線圖的例子;之前的博客也分享給DrawingVisual繪製曲線的方 ...
  • 如果你在自定義的 Main 方法中直接使用 App 類並啟動應用程式,但發現 App.xaml 中定義的資源沒有被正確載入,那麼問題可能在於如何正確配置 App.xaml 與你的 App 類的交互。 確保 App.xaml 文件中的 x:Class 屬性正確指向你的 App 類。這樣,當你創建 Ap ...
  • 一:背景 1. 講故事 上個月有個朋友在微信上找到我,說他們的軟體在客戶那邊隔幾天就要崩潰一次,一直都沒有找到原因,讓我幫忙看下怎麼回事,確實工控類的軟體環境複雜難搞,朋友手上有一個崩潰的dump,剛好丟給我來分析一下。 二:WinDbg分析 1. 程式為什麼會崩潰 windbg 有一個厲害之處在於 ...
  • 前言 .NET生態中有許多依賴註入容器。在大多數情況下,微軟提供的內置容器在易用性和性能方面都非常優秀。外加ASP.NET Core預設使用內置容器,使用很方便。 但是筆者在使用中一直有一個頭疼的問題:服務工廠無法提供請求的服務類型相關的信息。這在一般情況下並沒有影響,但是內置容器支持註冊開放泛型服 ...
  • 一、前言 在項目開發過程中,DataGrid是經常使用到的一個數據展示控制項,而通常表格的最後一列是作為操作列存在,比如會有編輯、刪除等功能按鈕。但WPF的原始DataGrid中,預設只支持固定左側列,這跟大家習慣性操作列放最後不符,今天就來介紹一種簡單的方式實現固定右側列。(這裡的實現方式參考的大佬 ...