我設計了個【方案】:比redis好10倍的kv庫【一統kv】

来源:https://www.cnblogs.com/piapia/archive/2023/05/04/17371154.html
-Advertisement-
Play Games

簡介 訪問者模式(Visitor Pattern)是一種行為型模式。它封裝一個訪問者類,把各元素類的操作集合起來,目的是將數據結構與數據操作分離。在不改變原有元素類數據結構的前提下,改變了元素類的執行演算法。 當某些較為穩定的東西(數據結構或演算法),不想直接被改變但又想擴展功能,這時候適合用訪問者模式 ...


我設計的redis9.0方案:redis自帶中間件

基於ssd磁碟,此我設計了比redis更好的緩存方案。此方案:沒有緩存擊穿問題。沒有緩存雪崩問題。沒有緩存污染問題。沒有熱key問題。
不需要snap和aof。支持任何sql庫,sql庫不需要帶有任何分散式功能。

 基於ssd磁碟,此我設計了比redis更好的緩存方案:在ssd上增加key的lru信息。從ssd到網路存儲,到sql。

 

redis 好10倍 一統kv 1.0 博客園
2023-0503,這個方案目前是1.0,方案會持續修補更新,版本號也會變。

世界上為什麼沒有這種3級資料庫?


cpu3級緩存,大家都知道吧。
cpu3級緩存的作用,大家都知道吧。就是分冷熱數據,冷數據淘汰。

那麼為什麼世界上,沒有一種【3級,冷熱數據自動分層,資料庫】?


--------【1級=記憶體級。lru隊列。】--------

記憶體級。lru隊列。隊列有容量限制。存儲redis相容的數據類型。隊列中的每個鍵值,都有一個熱度值。
客戶端來讀,已有數據:已有數據直接返回。
客戶端來讀,但本級無數據:絕不會去讀下級隊列,而是返回本級沒有數據。解決緩存污染問題。

整理隊列:只在沒有客戶端讀請求時做。
超出lru隊列的冷數據:放入寫隊列。寫後移除。
當記憶體空餘超過多少mb時,讀下級隊列中,最熱的100條數據。把下級熱度值一併讀取。

記憶體中,永遠只有最熱的key。不支持客戶端,把key寫入記憶體。

記憶體中的某些key,有個屬性,此屬性阻止key寫入到ssd磁碟。這樣的key斷電將丟失。

 

--------【2級=ssd磁碟級。】--------

 

直讀請求:
1本級已有數據,返回數據,不寫入上級隊列。支持限制併發數。
2本級無數據:則放入讀取下級隊列。定時從下級讀取。比如每隔2秒。讀取每個數據時,相鄰的16k數據一同讀取。返回數據,不寫入上級隊列。
支持對客戶端ip,限制併發數。比如,建立一個以客戶端ip為key。ip{k1=v1; k2=v2}把已經向下級查找,但未返回的數據,寫入到這個key中。
給這個key設置警告容量=50,最大容量=100。則超過100,返回:太頻繁的查詢。
支持對一批客戶端ip,設定限制警告,最大併發數。

寫請求:維護一個很小的緩衝區,基本每秒寫入。

 

整理隊列:
lru隊列:隊列有容量限制。隊列中的每個鍵值,都有一個熱度值。
超出lru隊列的冷數據:放入寫隊列。定時寫入下級,寫後移除。
幾乎必須要有這個功能:從kv到非kv,比如到sql,到存儲。
定時計算出本級最熱的100個key,算出幾個,以供上級讀取。


1級2級lru之間,有一個邊緣。這個邊緣記錄在一個變數中。臨近此邊緣的數據,會被頻繁移出,移入。
有一個設定值:
上級寫下來的冷數據:標記為最冷-2。
上級寫下來的冷數據:標記為最熱-100。

ssd中的某些key,有個屬性,此屬性阻止key寫入到下級存儲。這樣的key斷電不會丟失。但遷移時會被丟棄,導致丟失。

通過半夜運行的統計功能插件,實現熱key分門別類統計,為數據分片,分集群提供建議。
提供一個管理員命令,手動變更key的熱度。


還可以在這個中間件中實現:
1對後端3級庫分庫分表。
2對後端3級庫讀寫分離。
3對後端3級庫:從未分庫分表,到分庫分表,讀寫分離轉換。
4對後端3級庫:從1種分庫分表,讀寫分離,轉換到另一種分庫分表,讀寫分離的轉換。
5分散式cap,做在此中間件上。不需要後端資料庫,帶有任何分散式功能。不需要後端資料庫,帶有主從功能。

問:不需要後端資料庫,帶有任何分散式功能。為什麼?
問:它用什麼實現的cap?
答:
中間件自己,通過客戶端2步提交,實現了對資料庫的cap。
2步提交是一種傳統cap的手藝,並不神奇。


6這種庫(你叫中間件也可以),支持多種後端nosql,sql庫。只需要,用各種語言開發插件即可。
7
* 功能以腳本為介面,採用插件的方式。
* 支持各種語言編寫的插件。
* 插件運行後是獨立進程。支持各種資料庫的客戶端。
* 熱變更。沒有停服的概念。隨時啟動,停止所有功能。

 

集群:
通過一個標簽,如ip,或功能變數名稱,或項目名,來標識集群peer,最終寫入文件名。
對於集群,提供如下管理功能:
1 收。把ssd上的信息,丟棄掉不需要保存的後,從每個集群peer,按照項目備份。
2 放。把備份的恢復到ssd上。
3 整理熱key。根據key的熱度,在每個peer上平均key。通過這一點,可以達到熱key永遠平均分佈在每個peer。
經過熱key重新分佈後,在每個peer上的鍵值對,和項目無法一一對應。即節點1上,有項目125的熱key。

沒有人能事先知道哪些key熱。我的方案通過在ssd上存儲key的熱度,通過一個每天半夜運行的熱key移動程式,達到了熱key平均分佈在各個集群peer。

--------【3級=網路存儲。】--------

 

不分冷熱,存有所有數據。

 

--------【3級=任意sql,nosql資料庫。資料庫不需要帶cap,資料庫不需要帶主從。】--------

 

不分冷熱,存有所有數據。與上述3互斥。

 

 

--------【此資料庫的特性:】--------

 

1必須有2級存儲。即必須使用ssd。

2程式永遠只操作redis的kv對象,不關心是否有sql。
後端庫sql庫不關心kv功能。
因為所有的活,都被這個庫中的2級緩存中的,中間件幹了。

3對於一個冷讀取,至少需要等待3秒:即從3級庫hdd磁碟到2級磁碟等2秒,從2級磁碟到1級ssd等1秒。

4對於每個寫請求:可選寫入:4-1記憶體表示寫入成功,4-2寫入ssd表示寫入成功,4-3寫入hdd磁碟表示成功,4-4寫入分散式庫表示成功。
4-1會丟數據。丟數據情況為:斷電,進程死機,數據被列入隊列拋棄。234不會。這其中,最不重要的數據寫入4-1,其次大多數寫入4-2,剩下所有重要的數據寫入4-4。
從4-2,到4-3,或到4-4,只能管理員手動操作。給管理員提供一個命令即可。

5不需要redis的snap,和aof,落盤功能。因為上述234保證了數據安全。

ssd2級磁碟,相當於redis的snap。
hdd3級磁碟,相當於redis的snap的snap。但又不是單純的snap。這裡面有很多種玩法。

5-1 hsnap比ssnap更大。是資料庫,這樣就不需要任何sql資料庫,nosql庫。
5-2 hsnap文件的大小,格式,都可以自定義。
5-3 hsnap可以帶上功能變數名稱,伺服器ip。這樣就成了分散式緩存。如此一來只需要網路上的2個副本,redis3主3從集群也沒必要了。


6redis只是緩存,不能當庫用。redis不存冷數據,但這個庫可以。redis存儲空間有限,但這個庫可以看做空間無限。

6沒有緩存擊穿問題。沒有緩存雪崩問題。沒有緩存污染問題。沒有熱key問題。


--------【結論】--------

 

記憶體緩存 ---> ssd硬碟 ---> 網路存儲上的文件
記憶體緩存 ---> ssd硬碟 ---> nosql,sql資料庫 <--- 數據分析工具

 

問:為什麼說redis集群沒必要了?為什麼說redis集群錯了?

答:

網路磁碟分為:【單台】,【冗餘】。對於自帶冗餘的網路磁碟,我們只需要簡單的寫入1台即可。
這裡我們只談:【單台】。單台需要從ssd讀取,寫入到所有2台【單台】網路磁碟。這裡採用2步提交即可。
對於從【ssd】到【nosql,sql資料庫】也是採用2步提交。
也就是說redis的集群,維持心跳,都沒必要。
我再說明白點:
1客戶端給ab提交,帶著uuid,和寫入時間,只要成功寫入其中1台ssd即可。
2讀的時候,任意1台客戶機讀成功即可。

 

redis集群特色:
每個集群節點,只有部分數據。
通過分插槽的方法,儘量平均讀寫壓力。

本架構集群特色:

集群伺服器不需要選主。沒有raft。不需要3,5節點。支持1-4節點。

每個節點【最多】只需要2台網路副本,簡稱網路raid1。不分主,從。
基於2級磁碟ssd,可以人為手動,或配置文件自動,分庫,分表,合庫,合表。
繼而實現:分節點,合節點。


集群客戶端:


每個集群節點記憶體中,內有個key,含有所有集群的節點的ip,埠,版本。此key永遠存在記憶體中。
客戶端來讀,非本集群的key,返回錯誤。
客戶端來寫,非本集群的key,返回錯誤。
或者說從客戶端,選擇返回數據的伺服器。即,假如客戶端不知道某key所在的節點,客戶端首次讀寫某key,需要遍歷所有伺服器。
得到某個key所在的伺服器後,會把本key的伺服器ip,埠,寫在本地。
也就是說,客戶端維持每個key的伺服器屬性。這個屬性,保存到磁碟上。
當伺服器上的key,遷移到其他伺服器後,不會通知客戶端,只會返回錯誤。此時,客戶端將從新遍歷伺服器,以查找key的所在。

假設集群有10個節點,那麼客戶端最多讀10次,才能讀到key值。
為了給這個操作提速,可以增加一個【key索引伺服器】。
【key索引伺服器】也是一個記憶體kv庫。它頻繁從10個節點上的ssd中,讀key,然後建立索引。
有了【key索引伺服器】,客戶端只需要2次,即可讀到key值:
1讀key索引伺服器,返回此key所在的peer的ip,記錄在本地。
2從peer的ip,讀取值。
很顯然,集群節點少的情況,不需要【key索引伺服器】。


問:為什麼說redis的snap錯了?

答:
客戶端進來的數據,直接寫入ssd,相當於aof。
因為本架構不需要snap。本架構沒有snap過程。
在本架構中,1級緩存寫入數據到ssd,必須經過lru。分buffer,分時段,寫入。這個過程最多耗時1-2秒。即分片寫入。
而進程重啟後,從下級ssd緩存讀取,也只選擇ssd盤上lru隊列中的topn條數據,塞滿記憶體緩存的95%即可。
或者說redis的缺點是:snap保存到磁碟時,丟失了lru隊列信息。


--------【關於名字】--------

中文名字:一統kv
英文名字:kvAIO

這個資料庫架構,我看不但能夠一統kv,還能一統db。

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 在隨筆《基於SqlSugar的開發框架循序漸進介紹(28)-- 快速構建系統參數管理界面》中介紹了基於SqlSugar開發框架,構建系統參數管理的後端API部分,以及WInform界面部分內容,本篇隨筆介紹基於Vue3+ElementPlus的前端界面開發過程。 ...
  • 此文為系列文章第一篇,為淺嘗輒止的引入,目的是為了讓前端從業人員及非從業但是對此領域感興趣的人對於”前端“是乾什麼的這個話題有個無門檻的瞭解。 ...
  • 這裡給大家分享我在網上總結出來的一些知識,希望對大家有所幫助 1. 原型鏈 溫故而知新: 構造函數、原型和實例的關係: 每個構造函數都有一個原型對象,原型有一個屬性指回構造函數,實例有一個內部指針指向原型。 思考:如果原型是另一個類型的實例呢? 那就意味著這個原型本身有一個內部指針指向另一個原型,相 ...
  • 在HTML中, link 標簽是一個自閉合元素,通常位於文檔的 head 部分。它用於建立與外部資源的關聯,如樣式表、圖標等。 link 標簽具有多個屬性,其中 rel 和 href 是最常用的。 rel 屬性定義了當前文檔與鏈接資源之間的關係。常見的 rel 屬性值有: - stylesheet ...
  • 某次遇到一個從0到1的大型項目,該項目涉及兩個端,除了鑒權和部分業務邏輯不同外,頁面UI和其餘邏輯幾乎一致,遇到這種項目,該如何架構?既能保證項目順利開發完成,又能保證後期的迭代、維護、可擴展? ...
  • 本文從設計模式與編程語言的關係,設計模式與架構模式的區別,設計原則和設計模式的關係等幾個維度進行了分析和解答。關於設計模式應該如何學習和應用的問題,給出了學習意見和實踐心得。 ...
  • 前段時間,隨著阿裡集團CEO張勇的公開信發佈,阿裡集團也做出了歷史上最大的一次組織調整。 隨著新的1+6+N的組織陣型的調整和落地,阿裡曾經的中台戰略,變得有點非常的尷尬了,似乎成為了一個巨大的爭議。 ...
  • 回顧工廠方法設計模式的不足:具體產品增加時,系統中類的個數將成對增加,在一定程度上增加了系統的複雜度 模式動機 產品等級結構:產品等級結構即產品的繼承結構,即抽象產品與具體產品 產品族:在抽象工廠模式中,產品族是指由同一個工廠生產的,位於不同產品等級結構中的一組產品 模式定義 提供一個創建一系列相關 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...