簡介訪問者模式（Visitor Pattern）是一種行為型模式。它封裝一個訪問者類，把各元素類的操作集合起來，目的是將數據結構與數據操作分離。在不改變原有元素類數據結構的前提下，改變了元素類的執行演算法。當某些較為穩定的東西（數據結構或演算法），不想直接被改變但又想擴展功能，這時候適合用訪問者模式 ...

我設計的redis9.0方案：redis自帶中間件

基於ssd磁碟，此我設計了比redis更好的緩存方案。此方案：沒有緩存擊穿問題。沒有緩存雪崩問題。沒有緩存污染問題。沒有熱key問題。
不需要snap和aof。支持任何sql庫，sql庫不需要帶有任何分散式功能。

基於ssd磁碟，此我設計了比redis更好的緩存方案：在ssd上增加key的lru信息。從ssd到網路存儲，到sql。

redis 好10倍一統kv 1.0 博客園
2023-0503，這個方案目前是1.0，方案會持續修補更新，版本號也會變。

世界上為什麼沒有這種3級資料庫?

cpu3級緩存，大家都知道吧。
cpu3級緩存的作用，大家都知道吧。就是分冷熱數據，冷數據淘汰。

那麼為什麼世界上，沒有一種【3級，冷熱數據自動分層，資料庫】？

--------【1級=記憶體級。lru隊列。】--------

記憶體級。lru隊列。隊列有容量限制。存儲redis相容的數據類型。隊列中的每個鍵值，都有一個熱度值。
客戶端來讀，已有數據：已有數據直接返回。
客戶端來讀，但本級無數據：絕不會去讀下級隊列，而是返回本級沒有數據。解決緩存污染問題。

整理隊列：只在沒有客戶端讀請求時做。
超出lru隊列的冷數據：放入寫隊列。寫後移除。
當記憶體空餘超過多少mb時，讀下級隊列中，最熱的100條數據。把下級熱度值一併讀取。

記憶體中，永遠只有最熱的key。不支持客戶端，把key寫入記憶體。

記憶體中的某些key，有個屬性，此屬性阻止key寫入到ssd磁碟。這樣的key斷電將丟失。

--------【2級=ssd磁碟級。】--------

直讀請求：
1本級已有數據，返回數據，不寫入上級隊列。支持限制併發數。
2本級無數據：則放入讀取下級隊列。定時從下級讀取。比如每隔2秒。讀取每個數據時，相鄰的16k數據一同讀取。返回數據，不寫入上級隊列。
支持對客戶端ip，限制併發數。比如，建立一個以客戶端ip為key。ip｛k1=v1； k2=v2｝把已經向下級查找，但未返回的數據，寫入到這個key中。
給這個key設置警告容量=50，最大容量=100。則超過100，返回：太頻繁的查詢。
支持對一批客戶端ip，設定限制警告，最大併發數。

寫請求：維護一個很小的緩衝區，基本每秒寫入。

整理隊列：
lru隊列：隊列有容量限制。隊列中的每個鍵值，都有一個熱度值。
超出lru隊列的冷數據：放入寫隊列。定時寫入下級，寫後移除。
幾乎必須要有這個功能：從kv到非kv，比如到sql，到存儲。
定時計算出本級最熱的100個key，算出幾個，以供上級讀取。

1級2級lru之間，有一個邊緣。這個邊緣記錄在一個變數中。臨近此邊緣的數據，會被頻繁移出，移入。
有一個設定值：
上級寫下來的冷數據：標記為最冷-2。
上級寫下來的冷數據：標記為最熱-100。

ssd中的某些key，有個屬性，此屬性阻止key寫入到下級存儲。這樣的key斷電不會丟失。但遷移時會被丟棄，導致丟失。

通過半夜運行的統計功能插件，實現熱key分門別類統計，為數據分片，分集群提供建議。
提供一個管理員命令，手動變更key的熱度。

還可以在這個中間件中實現：
1對後端3級庫分庫分表。
2對後端3級庫讀寫分離。
3對後端3級庫：從未分庫分表，到分庫分表，讀寫分離轉換。
4對後端3級庫：從1種分庫分表，讀寫分離，轉換到另一種分庫分表，讀寫分離的轉換。
5分散式cap，做在此中間件上。不需要後端資料庫，帶有任何分散式功能。不需要後端資料庫，帶有主從功能。

問：不需要後端資料庫，帶有任何分散式功能。為什麼？
問：它用什麼實現的cap？
答：
中間件自己，通過客戶端2步提交，實現了對資料庫的cap。
2步提交是一種傳統cap的手藝，並不神奇。

6這種庫（你叫中間件也可以），支持多種後端nosql,sql庫。只需要，用各種語言開發插件即可。
7
* 功能以腳本為介面，採用插件的方式。
* 支持各種語言編寫的插件。
* 插件運行後是獨立進程。支持各種資料庫的客戶端。
* 熱變更。沒有停服的概念。隨時啟動，停止所有功能。

集群:
通過一個標簽，如ip，或功能變數名稱，或項目名，來標識集群peer，最終寫入文件名。
對於集群，提供如下管理功能：
1 收。把ssd上的信息，丟棄掉不需要保存的後，從每個集群peer，按照項目備份。
2 放。把備份的恢復到ssd上。
3 整理熱key。根據key的熱度，在每個peer上平均key。通過這一點，可以達到熱key永遠平均分佈在每個peer。
經過熱key重新分佈後，在每個peer上的鍵值對，和項目無法一一對應。即節點1上，有項目125的熱key。

沒有人能事先知道哪些key熱。我的方案通過在ssd上存儲key的熱度，通過一個每天半夜運行的熱key移動程式，達到了熱key平均分佈在各個集群peer。

--------【3級=網路存儲。】--------

不分冷熱，存有所有數據。

--------【3級=任意sql，nosql資料庫。資料庫不需要帶cap，資料庫不需要帶主從。】--------

不分冷熱，存有所有數據。與上述3互斥。

--------【此資料庫的特性：】--------

1必須有2級存儲。即必須使用ssd。

2程式永遠只操作redis的kv對象，不關心是否有sql。
後端庫sql庫不關心kv功能。
因為所有的活，都被這個庫中的2級緩存中的，中間件幹了。

3對於一個冷讀取，至少需要等待3秒：即從3級庫hdd磁碟到2級磁碟等2秒，從2級磁碟到1級ssd等1秒。

4對於每個寫請求：可選寫入：4-1記憶體表示寫入成功，4-2寫入ssd表示寫入成功，4-3寫入hdd磁碟表示成功，4-4寫入分散式庫表示成功。
4-1會丟數據。丟數據情況為：斷電，進程死機，數據被列入隊列拋棄。234不會。這其中，最不重要的數據寫入4-1，其次大多數寫入4-2，剩下所有重要的數據寫入4-4。
從4-2，到4-3，或到4-4，只能管理員手動操作。給管理員提供一個命令即可。

5不需要redis的snap，和aof，落盤功能。因為上述234保證了數據安全。

ssd2級磁碟，相當於redis的snap。
hdd3級磁碟，相當於redis的snap的snap。但又不是單純的snap。這裡面有很多種玩法。

5-1 hsnap比ssnap更大。是資料庫，這樣就不需要任何sql資料庫，nosql庫。
5-2 hsnap文件的大小，格式，都可以自定義。
5-3 hsnap可以帶上功能變數名稱，伺服器ip。這樣就成了分散式緩存。如此一來只需要網路上的2個副本，redis3主3從集群也沒必要了。

6redis只是緩存，不能當庫用。redis不存冷數據，但這個庫可以。redis存儲空間有限，但這個庫可以看做空間無限。

6沒有緩存擊穿問題。沒有緩存雪崩問題。沒有緩存污染問題。沒有熱key問題。

--------【結論】--------

記憶體緩存 ---> ssd硬碟 ---> 網路存儲上的文件
記憶體緩存 ---> ssd硬碟 ---> nosql，sql資料庫 <--- 數據分析工具

問：為什麼說redis集群沒必要了？為什麼說redis集群錯了？

答：

網路磁碟分為：【單台】，【冗餘】。對於自帶冗餘的網路磁碟，我們只需要簡單的寫入1台即可。
這裡我們只談：【單台】。單台需要從ssd讀取，寫入到所有2台【單台】網路磁碟。這裡採用2步提交即可。
對於從【ssd】到【nosql，sql資料庫】也是採用2步提交。
也就是說redis的集群，維持心跳，都沒必要。
我再說明白點：
1客戶端給ab提交，帶著uuid，和寫入時間，只要成功寫入其中1台ssd即可。
2讀的時候，任意1台客戶機讀成功即可。

redis集群特色：
每個集群節點，只有部分數據。
通過分插槽的方法，儘量平均讀寫壓力。

本架構集群特色：

集群伺服器不需要選主。沒有raft。不需要3，5節點。支持1-4節點。

每個節點【最多】只需要2台網路副本，簡稱網路raid1。不分主，從。
基於2級磁碟ssd，可以人為手動，或配置文件自動，分庫，分表，合庫，合表。
繼而實現：分節點，合節點。

集群客戶端：

每個集群節點記憶體中，內有個key，含有所有集群的節點的ip，埠，版本。此key永遠存在記憶體中。
客戶端來讀，非本集群的key，返回錯誤。
客戶端來寫，非本集群的key，返回錯誤。
或者說從客戶端，選擇返回數據的伺服器。即，假如客戶端不知道某key所在的節點，客戶端首次讀寫某key，需要遍歷所有伺服器。
得到某個key所在的伺服器後，會把本key的伺服器ip，埠，寫在本地。
也就是說，客戶端維持每個key的伺服器屬性。這個屬性，保存到磁碟上。
當伺服器上的key，遷移到其他伺服器後，不會通知客戶端，只會返回錯誤。此時，客戶端將從新遍歷伺服器，以查找key的所在。

假設集群有10個節點，那麼客戶端最多讀10次，才能讀到key值。
為了給這個操作提速，可以增加一個【key索引伺服器】。
【key索引伺服器】也是一個記憶體kv庫。它頻繁從10個節點上的ssd中，讀key，然後建立索引。
有了【key索引伺服器】，客戶端只需要2次，即可讀到key值：
1讀key索引伺服器，返回此key所在的peer的ip，記錄在本地。
2從peer的ip，讀取值。
很顯然，集群節點少的情況，不需要【key索引伺服器】。

問：為什麼說redis的snap錯了？

答：
客戶端進來的數據，直接寫入ssd，相當於aof。
因為本架構不需要snap。本架構沒有snap過程。
在本架構中，1級緩存寫入數據到ssd，必須經過lru。分buffer，分時段，寫入。這個過程最多耗時1-2秒。即分片寫入。
而進程重啟後，從下級ssd緩存讀取，也只選擇ssd盤上lru隊列中的topn條數據，塞滿記憶體緩存的95%即可。
或者說redis的缺點是：snap保存到磁碟時，丟失了lru隊列信息。

--------【關於名字】--------

中文名字：一統kv
英文名字：kvAIO

這個資料庫架構，我看不但能夠一統kv，還能一統db。

我設計了個【方案】：比redis好10倍的kv庫【一統kv】