AppBoxFuture: 二級索引及索引掃描查詢數據

来源:https://www.cnblogs.com/BaiCai/archive/2019/07/24/11239172.html
-Advertisement-
Play Games

  資料庫索引對於數據查詢的重要性不可言喻,因此作者在存儲層實現了二級索引,以及利用索引進行掃描的功能。目前僅實現了分區表與非分區表的本地索引(數據與索引共用一個Raft組管理),全局索引及反向索引待以後再實現。 一、存儲結構:   在介紹索引前先瞭解一下數據 ...


  資料庫索引對於數據查詢的重要性不可言喻,因此作者在存儲層實現了二級索引,以及利用索引進行掃描的功能。目前僅實現了分區表與非分區表的本地索引(數據與索引共用一個Raft組管理),全局索引及反向索引待以後再實現。

一、存儲結構:

  在介紹索引前先瞭解一下數據與索引是以何種結構存儲於RocksDB內的,每個節點的RocksDB實例都包含以下兩個ColumnFamily,每個列簇的存儲結構如下:

1. TableCF: 存儲實體數據

1.1 Key存儲編碼:

TableId(with OrderFlag) EntityId
32bit 128bit
  • OrderFlag用於EntityId按升序還是降序排列
  • EntityId包含實體創建時間戳,全局惟一

1.2 Value存儲編碼:

Versions GC Flag [VersionTS + DataPtr] [Data [FieldId + Value]]
15bit 1 bit Versions * (64+32bit) Versions * nbit
  • Versions表示該條記錄有多少個Mvcc版本
  • GC Flag表示第一個版本前是否被清理掉了
  • [VersionTS + DataPtr]其中VersionTS是混合邏輯時間戳,DataPtr指向此版本的數據位置,另外DataPtr=0xFFFFFFFF表示記錄刪除標記
  • 數據部分每100個(暫定)保存一個FullVersion的記錄數據,後跟差異部分

1.3 dbscan工具輸出示例:

2. IndexCF: 存儲索引數據

2.1 Key存儲編碼:

TableId IndexId IndexKey Values None unique index's EntityId
32bit 8bit [FieldId + Value] 128bit
  • IndexKey Values中的FieldId有一位是排序標誌位
  • None unique index's EntityID表示非惟一索引指向的目標,惟一索引存在於Value內

2.2 Value存儲編碼:

  與TableCF的Value編碼相同。

2.3 dbscan工具輸出示例:

二、索引管理:

  在新建實體模型及修改實體模型時均可添加與刪除索引(如下圖所示),需要註意的是修改模型時添刪索引會啟用非同步任務變更表結構並重建索引數據(請參考之前的文章:非同步結構變更),如果是重建惟一索引可能失敗,在實體模型設計器內可查看索引重建狀態。在索引重建過程中或重建失敗後利用索引掃描數據會直接報錯,告知索引尚未準備好。

三、索引掃描:

  不同於傳統Sql資料庫解析Sql後利用索引掃描,服務模型的代碼必須明確指定用哪個索引來查詢數據,具體參考以下示例代碼如何利用索引掃描數據:

public async Task<object> IndexScan()
{
    //新建索引掃描,範型參數1為實體類型,參數2為索引類型
    var q = new IndexScan<Entities.VehicleState, Entities.VehicleState.IX_VID_Speed>();
    //如果是分區表可通過分區謂詞指定分區掃描,非分區表無效
    q.Partitions.Equal(t => t.VID, 3);
    //可指定索引謂詞確定掃描範圍
    q.Keys.Equal(t => t.VID, 3);
    //如果是複合索引可指定其他索引謂詞
    q.Keys.Equal(t => t.Speed, 100);
    return await q.Take(10).ToListAsync();
}
  • 索引謂詞目前僅實現了相等性判斷,其他如大於、小於等稍後實現
  • 索引掃描的附加過濾條件尚未實現

  另如果需要插入一批測試數據可參考以下示例代碼:

public async Task<object> FillData()
{
    //第一個參數128表示並行任務數,第二個參數表示每個任務執行次數
    //作者虛擬機(I74C8G)執行以下代碼約每秒插入13000條記錄
    return await SimplePerfTest.Run(128, 500, async (i, j) =>
    {
        var obj = new Entities.VehicleState(i);
        obj.Speed = j;
        await EntityStore.SaveAsync(obj);
    });
}

四、本篇小結:

  本篇介紹數據及索引的存儲結構以及利用索引掃描api來查詢數據,下一步作者將實現其他謂詞條件,另外實現聚合掃描並優化單分區事務遞交。GitHub上的運行時已更新(包括dbscan工具)可供測試。如果您有問題或Bug報告,請留言或提交Issue,另外您的關註與點贊將是作者最大的動力。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 最近在做項目的時候發現的一個問題,通過ajax動態載入出來的一個button值綁定不了點擊事件。我使用的是datatables這款表單插件,表單內容是通過ajax動態渲染出來的。 解決方案: 通過Google,我發現在jquery1.7版本之前通常使用 .live() 這個事件,但是這個方法在1.9 ...
  • 首先我們還是先看一下WEB前端目前的工資情況吧,我在IT招聘網站拉勾網來進行搜索1-3年WEB前端工作經驗大專學歷的條件來看。 深圳: 可以看出目前深圳的平均的工資都在10K以上,因為大城市給的機會多,好公司也多,福利也好,所以在一線城市做WEB前端開發的,是非常稀缺的。 如果我們把標準降低在二線城 ...
  • vue更新換代很快,馬上vue都要出3.0了,這是一個巨大的變革,不過今天講的是vuecli3.0,裡面使用的vue仍然是2的,所有可以放心大膽使用。 Vue CLI 是一個基於 Vue.js 進行快速開發的完整系統,裡面所有具體介紹都可以去官網查看到 "vuecli官網移步" 這裡主要是講一些我實 ...
  • 譯者按: 使用 來捕獲所有的異常 原文: "Async Await Error Handling in JavaScript" 譯者: "Fundebug" 本文采用意譯,版權歸原作者所有 async/await 中的異常處理很讓人混亂。儘管有很多種方式來應對 "async 函數的異常" ,但是連經 ...
  • web前端全套視頻教程,html5,css3,javascript,.AngularJS. 下載地址 ...
  • 1.更換窗體圖標 方法:單擊窗體,更改icon屬性。 2.調整窗體打開時預設位置 方法:單擊窗體,更改StartPotion屬性。 3.修改窗體大小 方法:單擊窗體,更改Size屬性。 4.設置窗體的背景圖片 方法:單擊窗體,更改BackgroundImage屬性。 5.打開新窗體 首先新建一個窗體 ...
  • 1.馮·諾依曼體系 現代電腦的模型都是基於馮·諾依曼體系的,馮·諾依曼體系的基本組成有存儲器,計數器,控制器,輸入和輸出設備,總共有這五大本分組成。下圖是我基於這五大組成部分畫了一個組成圖來表示他們之間的關係,如圖1-1。 圖1-1 基於馮·諾依曼體系,首先控制器從記憶體中取出指令,有控制器來執行, ...
  • 前言 Adapter設計模式,允許客戶端使用介面不相容的類。 昨天收拾一些以前的東西,發現了藏在柜子里的一條線,這條線叫做OTG。這條線的一端是micro usb的輸出口,另一端是usb的輸入口。這條線,就是Adapter。手機如果想要使用U盤,會發現這個U盤的usb輸出口太大了,根本插不進手機的接 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...