Postgres 優雅存儲樹形數據_ZenDei技術網路在線

Postgres 優雅存儲樹形數據

-Advertisement-

碰到一個樹形數據需要存儲再數據控制，碰到以下兩個問題：在PG資料庫中如何表達樹形數據如何有效率的查詢以任意節點為Root的子樹測試數據為了更加簡單一些，我們將使用一下數據簡單的自引用當設計自引用表(有時候自己join自己)。最簡單明瞭的就是有一個欄位。然後插入一些樣例數據，用來關聯 ...

碰到一個樹形數據需要存儲再數據控制，碰到以下兩個問題：

在PG資料庫中如何表達樹形數據
如何有效率的查詢以任意節點為Root的子樹

測試數據

為了更加簡單一些，我們將使用一下數據

Section A
    |--- Section A.1

Section B
    |--- Section B.1
    |--- Section B.1
               |--- Section B.1.1

簡單的自引用

當設計自引用表(有時候自己join自己)。最簡單明瞭的就是有一個parent_id欄位。

CREATE TABLE section (
    id INTEGER PRIMARY KEY,
    name TEXT,
    parent_id INTEGER REFERENCES section,
);
ALTER TABLE page ADD COLUMN parent_id INTEGER REFERENCES page;
CREATE INDEX section_parent_id_idx ON section (parent_id);

然後插入一些樣例數據，用parent_id來關聯其他節點

INSERT INTO section (id, name, parent_id) VALUES (1, 'Section A', NULL);
INSERT INTO section (id, name, parent_id) VALUES (2, 'Section A.1', 1);
INSERT INTO section (id, name, parent_id) VALUES (3, 'Section B', NULL);
INSERT INTO section (id, name, parent_id) VALUES (4, 'Section B.1', 3);
INSERT INTO section (id, name, parent_id) VALUES (5, 'Section B.2', 3);
INSERT INTO section (id, name, parent_id) VALUES (6, 'Section B.2.1', 5);

再進行一些簡單的查詢時，這個方法非常好使。比如我們要查詢Section B的所有一級子節點

SELECT * FROM section WHERE parent = 3

但是如果要做複雜一些的查詢時，就很蛋疼了，查詢中會有許多複雜和遞歸的問題。比如我們要查詢Section B的所有子節點

WITH RECURSIVE nodes(id,name,parent_id) AS (
    SELECT s1.id, s1.name, s1.parent_id
    FROM section s1 WHERE parent_id = 3
        UNION
    SELECT s2.id, s2.name, s2.parent_id
    FROM section s2, nodes s1 WHERE s2.parent_id = s1.id
)
SELECT * FROM nodes;

這種方案解決了第一個問題，但是沒有解決第二個問題(高效的找到子樹)

Ltree extension

ltree extension來查詢樹形數據是個不錯的選擇，在自引用的關係表中表現的更加優秀。用ltree重新建一個表。我將用每一個section的主鍵作為ltree路徑中的標識。用root標識頂節點。

CREATE EXTENSION ltree;

CREATE TABLE section (
    id INTEGER PRIMARY KEY,
    name TEXT,
    parent_path LTREE
);

CREATE INDEX section_parent_path_idx ON section USING GIST (parent_path);

INSERT INTO section (id, name, parent_path) VALUES (1, 'Section 1', 'root');
INSERT INTO section (id, name, parent_path) VALUES (2, 'Section 1.1', 'root.1');
INSERT INTO section (id, name, parent_path) VALUES (3, 'Section 2', 'root');
INSERT INTO section (id, name, parent_path) VALUES (4, 'Section 2.1', 'root.3');
INSERT INTO section (id, name, parent_path) VALUES (4, 'Section 2.2', 'root.3');
INSERT INTO section (id, name, parent_path) VALUES (5, 'Section 2.2.1', 'root.3.4');

OK，一切搞定，我們可以用ltree操作符@>和<@來查詢Section B的所有子節點

SELECT * FROM section WHERE parent_path <@ 'root.3';

但是還是有一些小問題：

在parent_id這種方案中，我們有外鍵約束來維繫節點之間的關係，但是在Ltree版本中我們是沒有這種約束的
維戶這個樹每一個路徑都是有效，這其實是非常痛苦的。比如你的樹變大了，比如你操作的是很久之前的樹。總之搞不好有時候你查出來的是孤兒節點

最終解決方案

為瞭解決上章的兩個小問題，我們需要一種混搭(有parent_id還要高效易於維護)。為了達到這個目標，我們設計一個trigger來封裝樹操作的過程，更新樹僅僅靠更新parent_id。

CREATE EXTENSION ltree;

CREATE TABLE section (
    id INTEGER PRIMARY KEY,
    name TEXT,
    parent_id INTEGER REFERENCES section,
    parent_path LTREE
);

CREATE INDEX section_parent_path_idx ON section USING GIST (parent_path);
CREATE INDEX section_parent_id_idx ON section (parent_id);

CREATE OR REPLACE FUNCTION update_section_parent_path() RETURNS TRIGGER AS $$
    DECLARE
        path ltree;
    BEGIN
        IF NEW.parent_id IS NULL THEN
            NEW.parent_path = 'root'::ltree;
        ELSEIF TG_OP = 'INSERT' OR OLD.parent_id IS NULL OR OLD.parent_id != NEW.parent_id THEN
            SELECT parent_path || id::text FROM section WHERE id = NEW.parent_id INTO path;
            IF path IS NULL THEN
                RAISE EXCEPTION 'Invalid parent_id %', NEW.parent_id;
            END IF;
            NEW.parent_path = path;
        END IF;
        RETURN NEW;
    END;
$$ LANGUAGE plpgsql;


CREATE TRIGGER parent_path_tgr
    BEFORE INSERT OR UPDATE ON section
    FOR EACH ROW EXECUTE PROCEDURE update_section_parent_path();

這樣就爽多了.^_^.

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

SUSE12Sp3安裝配置.net core 生產環境（2）-安裝.NET Core 2.2.1 runtime 並運行.NET代碼

1、安裝 libicu 依賴 1、線上安裝顯示如下信息表示成功 2、離線安裝將文件aspnetcore runtime 2.2.1 linux x64.tar.gz複製到 /usr/local/dotnet 3、添加環境變數這個時候能看到所有的環境變數，找打並複製PATH一行，大概是下麵這樣。 ...
ubuntu下MySQL的安裝與卸載

Ubuntu下多次重裝MySQL，可以完全卸載後再安裝，本文將結束MySQL的安裝與卸載方法。 ...
【轉載】Docker+Kubernetes 乾貨文章精選

主要涉及到以下關鍵字： K8S、Docker、微服務、安裝、教程、網路、日誌、存儲、安全、工具、CI/CD、分散式、實踐、架構等；以下盤點2018年一些精選優質文章！漫畫形式：漫畫：小黃人學 Service Mesh 之 Istio漫畫：Kubernetes中的ConfigMap和Secret ...
mysql存儲之int

開始之前給大家出個問題，資料庫表test中兩個欄位 a int(2),b int(3)，現在想執行下麵的插入語句思考是否可以插入？答案是能插入再看下麵的語句思考能不能插入？註意第一個數字多了一位變成了11位資料庫會報如下錯誤 “Out of range value for column ' ...
轉換CLOB欄位類型為VARCHAR2, lob類型不支持的sql語句

轉自：https://blog.csdn.net/e_wsq/article/details/7561209 步驟： 1.建立一個臨時varchar2欄位用來保存數據 2.將clob的內容截取後更新到varchar2欄位中 update table_wonder set tempcolumn = d ...
命令行操作mysql 未完待續......

複製數據表刪除表中某個欄位查看表結構未完待續...... ...
SQL Server 查找統計信息的相關採樣信息

SQL Server 查找統計信息的相關採樣信息有時候我們會遇到，由於統計信息不准確導致優化器生成了一個錯誤的執行計劃（或者這樣表達：一個較差的執行計劃），從而引起了系統性能問題。那麼如果我們懷疑這個錯誤的執行計劃是由於統計信息不准確引起的。那麼我們如何判斷統計信息不准確呢？當然首先得去查看實際執... ...
不一樣的 SQL Server 日期格式化

最近統計一些數據，需要按天/按小時/按分鐘來統計，涉及到一些日期的格式化，網上看了一些文章大部分都是使用 `CONVERT` 來轉換的，SQL Server 從 2012 開始增加了 `FORMAT` 方法，可以使用 `FORMAT` 來格式化日期，更標準化，更具可定製性，而且和 C# 里的日期格式... ...