6.InfluxDB-InfluxQL基礎語法教程--GROUP BY子句

来源:https://www.cnblogs.com/suhaha/archive/2019/10/17/11692281.html
-Advertisement-
Play Games

本文翻譯自官網,官網地址:(https://docs.influxdata.com/influxdb/v1.7/query_language/data_exploration/) GROUP BY子句通過用戶自己制定的tags set或time區間,來將查詢結果進行分組。 一、GROUP BY ta ...


本文翻譯自官網,官網地址:(https://docs.influxdata.com/influxdb/v1.7/query_language/data_exploration/)

GROUP BY子句通過用戶自己制定的tags set或time區間,來將查詢結果進行分組。

一、GROUP BY tags

GROUP BY 通過用戶指定的tag set,來對查詢結果進行分組。
語法:

SELECT_clause FROM_clause [WHERE_clause]
GROUP BY [* | <tag_key>[,<tag_key]]
GROUP BY子句 意義
GROUP BY * 使用所有tag對查詢結果進行分組
GROUP BY <tag_key> 使用指定tag對查詢結果進行分組
GROUP BY <tag_key>,<tag_key> 使用指定的多個tag對查詢結果進行分組,其中tag之間的順序是無關的。

:如果在sql中同時存在WHERE子句和GROUP BY子句,則GROUP BY子句一定要在WHERE子句之後!

Other supported features: Regular Expressions


GROUP BY tags 示例sql

  1. Group query results by a single tag

    上面的sql使用了MEAN函數,來對h2o_feet這個measurement中的location這個tag進行分組求平均值。
    註:在InfluxDB中,0紀元1970-01-01T00:00:00Z這個時間經常被用來表示timestamp的NULL值。如果你的查詢中沒有顯示指定返回一個timestamp,比如上面在調用聚合函數時,就沒有指定時間區間,因此InfluxDB最後返回0紀元來作為timestamp。

  2. Group query results by more than one tag

  3. Group query results by all tags


二、基礎GROUP BY time intervals

GROUP BY time() 查詢會將查詢結果按照用戶指定的時間區間來進行分組。
語法:

SELECT <function>(<field_key>) FROM_clause
WHERE <time_range>
GROUP BY time(<time_interval>),[tag_key] [fill(<fill_option>)]

基本的 GROUP BY time() 查詢用法需要在SELECT子句中調用相關函數,並且在WHERE子句中調用time時間區間。

  • time(time_interval)
    在GROUP BY time()子句中的time_interval是個連續的時間區間,該時間區間決定了InfluxDB如何通過時間來對查詢結果進行分組。比如,如果time_interval為5m,那麼它會將查詢結果分為5分鐘一組(如果在WHERE子句中指定了time區間,那麼就是將WHERE中指定的time區間劃分為沒5分鐘一組)。
  • fill(<fill_option>)
    fill(<fill_option>) 是可選的。它可以填充那些沒有數據的時間區間的值。 從 [GROUP BY time intervals and fill() ] (https://docs.influxdata.com/influxdb/v1.7/query_language/data_exploration/#group-by-time-intervals-and-fill) 部分可查看到關於這部分的更多信息。

    註:基本的GROUP BY time()查詢通過當前InfluxDB資料庫的預設時間邊界來確定每個時間間隔中包含的原始數據和查詢返回的時間戳。


基本用法示例sql

先看一個WHERE查詢

下麵的GROUP BY time(time_interval)示例是在上面的sql基礎上進行改進的,sql為:

SELECT COUNT("water_level") FROM "h2o_feet"
WHERE "location"='coyote_creek'
    AND time >= '2015-08-18T00:00:00Z'
    AND time <= '2015-08-18T00:30:00Z'
GROUP BY time(12m)

查詢結果:

該sql將h2o_feet表中tag=“coyote_creek”,且在'2015-08-18T00:00:00Z'和'2015-08-18T00:30:00Z'時間區間內的數據查詢出來,並對其劃分為每12分鐘一組,對water_level值進行count計算。
註意:在查詢結果中,時間區間是左閉右開的。拿第一行查詢結果數據來說,2015-08-18T00:00:00Z表示的時間區間是[2015-08-18T00:00:00, 2015-08-18T00:12:00Z )


常見問題

問題:查詢結果中有預期之外的時間區間和值。
在基本用法中,GROUP BY time()查詢通過當前InfluxDB資料庫的預設時間邊界來確定每個時間間隔中包含的原始數據和查詢返回的時間戳,這有可能會導致預期之外的結果值。
比如,通過如下sql:

SELECT "water_level" FROM "h2o_feet"
WHERE "location"='coyote_creek'
    AND time >= '2015-08-18T00:00:00Z'
    AND time <= '2015-08-18T00:18:00Z'

我們查詢到原始數據如下所示:

在接下來的查詢中,我們通過WHERE子句,指定查詢12分鐘內的數據,並通過GROUP BY子句,將查詢結果按12分鐘的時間區間進行分組。

SELECT COUNT("water_level") FROM "h2o_feet"
WHERE "location"='coyote_creek'
    AND time >= '2015-08-18T00:06:00Z'
    AND time < '2015-08-18T00:18:00Z'
GROUP BY time(12m)

按照預想,因為查詢的是12分鐘內的數據,並且group by時是按照12分鐘來進行分組的,所以最後的查詢結果應該只有一行而已。然後實際的查詢結果卻有兩行:

解釋
influxdb使用預設的整數時間邊界來作為GROUP BY的時間間隔,這些間隔獨立於WHERE子句中的任何時間條件。在計算結果時,所有返回的數據都必須出現在WHERE查詢的顯式時間範圍內,但當按間隔作為GROUP BY分組時是基於預設的時間邊界。
(這裡翻譯的不好,下麵是原版英文:
InfluxDB uses preset round-number time boundaries for GROUP BY intervals that are independent of any time conditions in the WHERE clause. When it calculates the results, all returned data must occur within the query’s explicit time range but the GROUP BY intervals will be based on the preset time boundaries.

高級的GROUP BY time()語法允許用戶自定義預設時間邊界的開始時間。在高級語法小節的示例sql3中,將展示這種用法,它查詢的結果如下:


三、高級GROUP BY time() 語法

語法如下:

SELECT <function>(<field_key>)
FROM_clause
WHERE <time_range>
GROUP BY time(<time_interval>,<offset_interval>),[tag_key] [fill(<fill_option>)]

在GROUP BY time()高級語法中,需要在SELECT子句中調用InfluxDB的函數,併在WHERE子句中指定時間區間。並且需要註意到的是,GROUP BY子句必須在WHERE子句之後!

  • time(time_interval,offset_interval)
    在GROUP BY time()子句中的通過time_interval和offset_interval來表示一個連續的時間區間,該時間區間決定了InfluxDB如何通過時間來對查詢結果進行分組。比如,如果時間區間為5m,那麼它會將查詢結果分為5分鐘一組(如果在WHERE子句中指定了time區間,那麼就是將WHERE中指定的time區間劃分為沒5分鐘一組)。
    offset_interval是持續時間文本。它向前或向後移動InfluxDB資料庫的預設時間邊界。offset_interval可以為正或負。

  • fill(<fill_option>)
    fill(<fill_option>)是可選的。 它可以填充那些沒有數據的時間區間的值。 從 GROUP BY time intervals and fill() 部分可查看到關於這部分的更多信息。

    :高級 GROUP BY time() 語法依賴於time_interval、offset_interval、以及 InfluxDB 資料庫的預設時間邊界來確定每組內的數據條數、以及查詢結果的時間戳。


高級用法示例sql

先看如下查詢sql

SELECT "water_level" FROM "h2o_feet"
WHERE "location"='coyote_creek'
    AND time >= '2015-08-18T00:00:00Z'
    AND time <= '2015-08-18T00:54:00Z'

查詢結果:

接下來將使用上面的樣例數據的子集來進行演示。以下sql將按照每18m對數據進行進組,並將預設的時間界限前移。

ELECT MEAN("water_level") FROM "h2o_feet"
WHERE "location"='coyote_creek'
    AND time >= '2015-08-18T00:06:00Z'
    AND time <= '2015-08-18T00:54:00Z'
GROUP BY time(18m,6m)

查詢結果:

可見上面sql將查詢結果按照每18m為一組進行了分組,並且將預設的時間界限偏移了6分鐘。
註意,對於沒有offset_interval的group by time(),它的查詢結果的時間邊界和返回的時間戳遵循influxdb資料庫的預設時間邊界。下麵我們看offset_interval的group by time()的查詢結果:

SELECT MEAN("water_level") FROM "h2o_feet"
WHERE "location"='coyote_creek'
    AND time >= '2015-08-18T00:06:00Z'
    AND time <= '2015-08-18T00:54:00Z'
GROUP BY time(18m)


再看如下sql:

SELECT MEAN("water_level") FROM "h2o_feet"
WHERE "location"='coyote_creek'
    AND time >= '2015-08-18T00:06:00Z'
    AND time <= '2015-08-18T00:54:00Z'
GROUP BY time(18m,-12m);

查詢結果

:該sql使用的是time(18m,-12m),offset_interval是負數,它的查詢結果跟使用time(18m,6m)是一樣的。因此在決定正負偏移間隔時,請隨意選擇最直觀的選項。


GROUP BY time intervals and fill()

Fill() 可以填充那些沒有數據的時間區間的值。
語法:

SELECT <function>(<field_key>) FROM_clause
WHERE <time_range>
GROUP BY time(time_interval,[<offset_interval])[,tag_key] [fill(<fill_option>)]

預設情況下,在GROUP BY time()查詢結果中,若某個時間區間沒有數據,則該時間區間對應的值為null。通過fill(),就可以填充那些沒有數據的時間區間的值。
需要註意的是,fill()必須出現在GROUP BY子句的最後。

Fill選項

  1. 任何數學數值
    使用給定的數學數值進行填充
  2. linear
    為沒有數據值的時間區間線性插入數值,使得插入之後的數值,跟其他本來就有數據的區間的值成線性。(這裡翻譯的不是很好,看示例就能明白了)
  3. none
    若某個時間區間內沒有數據,則在查詢結果中該區間對應的時間戳將不顯示出來
  4. null
    沒有值的區間,顯示為null。這也是預設的選項。
  5. previous
    用前一個區間的數值來填充當前沒有數據的區間的值。

示例:

  1. fill(100)

  2. fill(linear)

  3. fill(none)

  4. fill(null)

  5. fill(previous)



您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 常用命令: 查看塊設備分區信息cat /proc/mtd 查看塊設備信息mtdinfo /dev/mtd0 格式化mtd分區ubiformat /dev/mtd0 將mtd分區與ubi關聯ubiattach /dev/ubi_ctrl -m 0 取消關聯ubidetach /dev/ubi_ctrl ...
  • 下載:https://www.mongodb.com/ 安裝:略 註意: 使用前修改bin目錄下配置文件mongodb.cfg,刪除最後一行的'mp'欄位 1. 啟動服務與終止服務 2.創建管理員用戶 3.使用賬戶密碼連接mongodb 4.資料庫 查看資料庫 切換資料庫 增加資料庫 刪除資料庫 5 ...
  • kylin從入門到實戰:實際案例:https://www.cnblogs.com/bigdataer/p/6709783.html (不知道是不是這樣理解:Measures添加中必須有COUNT,然後再添加其他的SUM,MIN等等這樣不會報錯) ...
  • ``` mysql> show variables like '%increment%'; + + + | Variable_name | Value | + + + | auto_increment_increment | 2 | | auto_increment_offset | 1 | | d... ...
  • 一、linux中MySQL出現中文亂碼問題如下操作 1.編輯vi /etc/my.cnf文件,添加圖中標記三行 [client] default-character-set=utf8 [mysqld] character-set-server=utf8 [mysql] default-charact ...
  • Elasticsearch 的API 分為 REST Client API(http請求形式)以及 transportClient API兩種。相比來說transportClient API效率更高,transportClient 是通過Elasticsearch內部RPC的形式進行請求的,連接可以 ...
  • 本文翻譯自官網,官網地址:(https://docs.influxdata.com/influxdb/v1.7/query_language/data_exploration/) LIMIT和SLIMIT分別用於限制InfluxDB中每次查詢時返回的points或series的數目。 一、LIMIT ...
  • 本文翻譯自官網,官網地址:(https://docs.influxdata.com/influxdb/v1.7/query_language/data_exploration/) 在InfluxDB中查詢時,預設返回的數據時按照time升序排序的。而通過ORDER BY time DESC子句,可以 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...