記一次ES查詢數據突然變為空的問題

来源:https://www.cnblogs.com/huangying2124/archive/2019/11/05/11796112.html
-Advertisement-
Play Games

基本環境 elasticsearch版本:6.3.1 客戶端環境:kibana 6.3.4、Java8應用程式模塊。 其中kibana主要用於數據查詢診斷和查閱日誌,Java8為主要的客戶端,數據插入和查詢都是由Java實現的。 案例介紹 使用elasticsearch存儲訂單的主要信息,docum ...


基本環境

  • elasticsearch版本:6.3.1
  • 客戶端環境:kibana 6.3.4、Java8應用程式模塊。
    其中kibana主要用於數據查詢診斷和查閱日誌,Java8為主要的客戶端,數據插入和查詢都是由Java實現的。

案例介紹

使用elasticsearch存儲訂單的主要信息,document內的field,基本上是long或keyword,創建索引的order.json文件如下:

{
  "doc": {
    "properties": {
      "id": {
        "type": "keyword",
        "index": true
      },
      "status": {
        "type": "byte",
        "index": true
      },
      "createTime": {
        "type": "long",
        "index": true
      },
      "uid": {
        "type": "long",
        "index": true
      },
      "payment": {
        "type": "keyword",
        "index": true
      },
      "commentStatus": {
        "type": "byte",
        "index": true
      },
      "refundStatus": {
        "type": "byte",
        "index": true
      }
    }
  }
}

某天發現有個查詢功能(單獨使用payment欄位查詢)沒有數據出來,最近未修改此部分代碼。對比研發環境,研發環境是正常的,同樣的代碼在測試環境下無數據返回。

問題定位

  • 程式中使用該欄位用的是termQuery,如下:
QueryBuilders.termQuery("payment", req.getFilter().getOrder().getPayment())

在kibana上用命令診斷查詢數據,同樣沒有結果返回,查詢命令如下:

GET /order/doc/_search
{
  "query": {
    "bool": {
      "must": [
        {"term": {
          "payment": "Alipay"
        }}
      ]
    }
  }
}
  • 查詢mapping信息,看是否為keyword:

GET /order/_mapping/doc

響應返回(只展示payment欄位):

{
  "order": {
    "mappings": {
      "doc": {
        "properties": {
          "payment": {
            "type": "text",
            "fields": {
              "keyword": {
                "type": "keyword",
                "ignore_above": 256
              }
            }
          }
        }
      }
    }
  }
}

問題原因

按照mapping返回結果來看,欄位payment原定義的類型是keyword,現在變成text了,這個是payment欄位使用termQuery查詢導致沒有數據的原因。

text與keyword的區別

keyword對保存的內容不分詞,也不改變大小寫,原樣存儲,預設可索引。
text對內容進行分詞,並且全部小寫存儲,同時會增加一個text.keyword欄位,為keyword類型,超過256字元後不索引。

由於payment欄位變成text了,原有的程式使用term查詢,用的"Alipay",而text存儲的是"alipay",所以查不到數據了。

嘗試排錯方法

  • payment的值改成小寫
GET /order/doc/_search
{
  "query": {
    "bool": {
      "must": [
        {"term": {
          "payment": "alipay"
        }}
      ]
    }
  }
}
  • 或將term查詢改成match查詢
GET /order/doc/_search
{
  "query": {
    "bool": {
      "must": [
        {
            "match": {
              "payment": "alipay"
            }
        }
      ]
    }
  }
}

查詢有數據輸出,並且符合預期,嘗試方法有效。

問題追溯

明明order.json的對payment欄位定義的類型是keyword,怎麼變成text了?

由於出現此問題的環境是測試環境,有重刪索引數據,然後再全部導入的操作(有點不規範,但僅限於測試環境,生產環境不會這麼做),重新導入索引document數據的功能,es創建索引自動mapping時,payment欄位的string內容,會變成text。

解決辦法:

1.刪除索引

DELETE /order

2.按照order.json重建索引

PUT /order
{
    "mappings": {
        "doc": {
            "properties": {
              "id": {
                "type": "keyword",
                "index": true
              },
              "status": {
                "type": "byte",
                "index": true
              },
              "createTime": {
                "type": "long",
                "index": true
              },
              "uid": {
                "type": "long",
                "index": true
              },
              "payment": {
                "type": "keyword",
                "index": true
              },
              "commentStatus": {
                "type": "byte",
                "index": true
              },
              "refundStatus": {
                "type": "byte",
                "index": true
              }
            }
        }
    }
}

3.觸發程式灌數據(也可以用bulk)

小結

問題雖小,但一定要追溯源頭,比如此次測試環境的不規範操作。後期如果有刪除索引的操作,應該先手動建立索引後,再灌數據,而不是直接讓其自動mapping建立索引,自動mapping建立的欄位類型,可能不是我們期望的。

專註Java高併發、分散式架構,更多技術乾貨分享與心得,請關註公眾號:Java架構社區
Java架構社區


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 工作中偶爾會出現:想用A數據表替換B數據表,然後把B數據表刪除。但是,又不知道B數據表在哪個視圖、存儲過程、函數、觸發器中使用過? 經過一番度娘,看到實現方法也不難,主要涉及兩個系統表:sysobjects及syscomments。 1、先來複習一下sysobjects表結構。 列名 數據類型 描述 ...
  • MySQL DDL操作執行的三種方式 1,INPLACE,在進行DDL操作時,不影響表的讀&寫,可以正常執行表上的DML操作,避免與COPY方法相關的磁碟I/O和CPU周期,從而最小化資料庫的總體負載。 最小化負載有助於在DDL操作期間保持良好的性能和高吞吐量。 2,COPY,不允許併發執行過多個D ...
  • 在註冊表中找到 HKEY_CURRENT_USER\Software 選中其中的類似下列文件名的文件 HKEY_CURRENT_USER\Software\{d58cb4b1-47f3-45cb-a209-f298d0c3f756} HKEY_CURRENT_USER\Software\{FBC48 ...
  • 許多時候當要使用Mysql時,會遇到如下情況: 1. 信息比較重要,希望通信被加密。2. 一些埠,比如3306埠,被路由器禁用。 對第一個問題的一個比較直接的解決辦法就是更改mysql的代碼,或者是使用一些證書,不過這種辦法顯然不是很簡單。 這裡要介紹另外一種方法,就是利用SSH通道來連接遠程的 ...
  • [root@test153 ~]# /usr/local/mysql/bin/mysqld --initialize --user=mysql --basedir=/usr/local/mysql --datadir=/data/mysql_data1 /usr/local/mysql/bin/my ...
  • 創建表空間及用戶CREATE TABLESPACE OracleDBFDATAFILE 'D:\app\zhoulx\oradata\bdc\OracleDBF.DBF' SIZE 100M AUTOEXTEND ON NEXT 20M MAXSIZE UNLIMITED -- 這裡是你設置資料庫存 ...
  • 1.select * from SYS_DICT as of timestamp to_timestamp('2019-11-05 10:00:00','yyyy-mm-dd hh24:mi:ss'); 時間點在刪除數據之前,又儘量精確 sys_dict 是表名 2.insert into SYS_ ...
  • 阿裡開發手冊的描述,禁止多表join: 手冊上寫著【強制】,相信很多同學項目裡面的代碼都不滿足這個要求。 但是關鍵問題是:不用join,這SQL究竟要怎麼寫?! 分解關聯查詢 即對每個要關聯的表進行單表查詢,然後將結果在應用程式中進行關聯。下麵的這個查詢: 可以分解成下麵這些查詢來代替: 但是該方案 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...