字典服務的設計與管理

来源:https://www.cnblogs.com/cicada-smile/archive/2022/08/22/16614338.html
-Advertisement-
Play Games

編碼問題,誰不想避其鋒芒; 一、業務背景 在搜索引擎的功能上,曾經遇到過這樣一個問題,資料庫中某個公司名稱中存在特殊編碼,儘管數據已經正常同步到索引中,但是系統中關鍵詞始終也無法匹配到該公司; 然後在庫中模糊匹配,將公司名稱複製到搜索框中,這樣就可以正常命中索引,那麼問題也就很清楚了,這種數據"隱身 ...


編碼問題,誰不想避其鋒芒;

一、業務背景

在搜索引擎的功能上,曾經遇到過這樣一個問題,資料庫中某個公司名稱中存在特殊編碼,儘管數據已經正常同步到索引中,但是系統中關鍵詞始終也無法匹配到該公司;

然後在庫中模糊匹配,將公司名稱複製到搜索框中,這樣就可以正常命中索引,那麼問題也就很清楚了,這種數據"隱身"的情況,即看著是同一個字,但是實際上不是,通常由特殊編碼引起的;

通過表單進行數據採集是常用的業務手段,但是如果表單存在多個任意輸入的文本框,這樣獲取的數據在質量上可能存在很多欠缺,尤其針對一些核心欄位,嚴謹的校驗規則十分有必要;

如果站在數據層面來看,雖然獲取多維度數據有利於全景識別,但是各個維度的值準確與否或質量高低才是關鍵,對於多數業務場景來說,只依賴數據實體的部分屬性,更多還是在於數據維度的質量;

提高數據質量的手段中,最行之有效的方式就是儘可能對欄位維度提供枚舉值,將數據內容限制在約定的範圍內,其次就是校驗規則需要嚴謹,以此確保業務數據的高質量;

二、字典服務

在分散式系統架構中,比較常見的基礎服務層通常有:調度、緩存、文件、消息、字典等,下麵就來詳細的聊聊字典服務的設計與業務協作的邏輯;首先看一看交互邏輯:

在字典服務中,通常管理公共的常量與數據枚舉值的維護;常規情況下,在業務表單載入的時候,從字典服務中讀取各維度枚舉值,在表單提交的時候,校驗相關枚舉欄位,以此提高內容的質量;

在字典服務中提供的枚舉值,根本目的是為了確保數據值的統一性,儘可能的避免同一個信息用兩種方式描述,比如編程標簽:"JAVA"與"Java",雖然從程式角度可以規避識別,但實際上是可以避免的;

從字典服務常見的內容管理來看,通常包括:常量、狀態描述、業務標識;行業、標簽、地址、學校等數據碼表;其最大的特點就是在系統中被全局復用和識別;

三、細節設計

1、維護方式

對於字典數據的維護,通常使用兩種手段:枚舉類管理,碼表存儲,參數表存儲;如何選擇對應的方式,更多是取決於數據的屬性:

  • 枚舉類:維護基本不會改變的欄位,比如數據的常規狀態描述;
  • 碼表:通常數據具有層次或者級聯關係,比如地址和行業中的多級聯動;
  • 參數表:即時要求很高,例如欄位枚舉值的定義,需要動態實時管理;

不管使用那種方式管理字典數據,都需要增強業務語義的描述,這樣在業務表單中通過相應標識讀取對應枚舉選項即可,並且攔截範圍之外的提交動作;

2、數據載入

字典數據的查詢通常採用Cache-Aside緩存模式,即查詢優先訪問緩存數據,命中則返回數據;否則訪問庫表數據,獲取數據後返回頁面並同步緩存中;在控制中心做內容修改後也需要再次同步緩存;

字典服務雖然並不複雜的,但是系統訪問卻十分頻繁,如果出現異常情況很容易對業務產生大規模的影響,既要考慮併發訪問的流量,又要設計合理的查詢降低載入時間,避免對流程產生有感知的影響;

3、數據修改

不管是採用字典方式載入枚舉值,還是採用任意輸入的方式,都會面對一個無法避開的問題,欄位值在業務開發中不斷優化,則需要對數據進行清洗,至於數據清洗的流程在之前有詳細的總結過,這裡不再贅述。

四、數據意識

數據字典本身的邏輯比較簡單,但是如果放在數據體系中,這是一種基礎的意識,在數據中很容易出現同名但定義不同,或者定義相同但名稱不同,這會給數據分析帶來很多不必要的麻煩;

所以基於數據字典的方式,明確數據口徑同時避免業務語義產生分歧,尤其對於漢語來說,"意思"到底是什麼意思?

五、參考源碼

編程文檔:
https://gitee.com/cicadasmile/butte-java-note

應用倉庫:
https://gitee.com/cicadasmile/butte-flyer-parent
Gitee主頁: https://gitee.com/cicadasmile/butte-java-note
您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 組件之間的迴圈引用 點擊打開視頻講解更詳細 假設你需要構建一個文件目錄樹,像訪達或資源管理器那樣的。你可能有一個 <tree-folder> 組件,模板是這樣的: <p> <span>{{ folder.name }}</span> <tree-folder-contents :children=" ...
  • 在面向對象出現之前,已有面向過程的分析方法,為什麼面向對象被提出了呢?究其本質原因,人們發現面向過程並不是按照人正常認識事物的方式去分析軟體,那麼人究竟是怎麼認識事物的呢,Yourdon 在《面向對象的分析》一書中提到,人類認識事物是遵循分類學的原理,分類學主要包含三點:區分對象及其屬性;區分整體對... ...
  • MEMS感測器即微機電系統(Micro-electro Mechanical Systems),是指將精密機械繫統與微電子電路技術結合發展出來的一項工程技術,它的尺寸一般在微米量級。 ...
  • 同步、非同步,併發、並行、串列,這些名詞在我們的開發中會經常遇到,這裡對非同步編程做一個詳細的歸納總結,希望可以對這方面的開發有一些幫助。 ...
  • 我們從應用的視角出發整理抽象了我們在訪問、使用資料庫時場景的一些穩定性治理、性能優化、提效等方面的實戰經驗,對於每一個後端應用來說,資料庫無疑是重中之重,我們希望通過我們的資料庫治理能力,可以幫助到大家更好地使用資料庫服務。 本文將詳細介紹 MSE 資料庫治理的熱點功能,動態讀寫分離的設計與實現。 ...
  • 設計原則為提高可維護性和可復用性而生,每一種設計模式都符合一個或多個設計原則,因此設計原則也是評價一個設計模式使用效果的重要指標之一。 ...
  • 目錄 一.簡介 二.效果演示 三.源碼下載 四.猜你喜歡 零基礎 OpenGL (ES) 學習路線推薦 : OpenGL (ES) 學習目錄 >> OpenGL ES 基礎 零基礎 OpenGL (ES) 學習路線推薦 : OpenGL (ES) 學習目錄 >> OpenGL ES 轉場 零基礎 O ...
  • 關於安裝 進入pom.xml文件目錄下,使用命令mvn install 當然也可以使用類似idea這類本身已經集成好maven插件按鈕的編輯器進行安裝 安裝過程會輸出安裝jar包的目錄信息,同樣的,跟class編譯後的目標文件一起,放在target目錄下 註意:開發編譯過程中,如果只 編譯 mvn ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...