和關係資料庫一樣,Neo4j同樣可以創建索引來加快查找速度。 在關係資料庫中創建索引需要索引欄位和指向記錄的指針,通過索引可以快速查找到表中的行。 在Neo4j中,其索引是通過屬性來創建,便於快速查找節點或者關係。 手動索引 先來說一下怎樣創建手動索引。 創建索引採用顯示創建,就像添加節點一樣添加索 ...
和關係資料庫一樣,Neo4j同樣可以創建索引來加快查找速度。
在關係資料庫中創建索引需要索引欄位和指向記錄的指針,通過索引可以快速查找到表中的行。
在Neo4j中,其索引是通過屬性來創建,便於快速查找節點或者關係。
手動索引
先來說一下怎樣創建手動索引。
創建索引採用顯示創建,就像添加節點一樣添加索引項,一個索引項標識的是一個節點或者關係的屬性值。
索引項中除了包含屬性值,還存儲了對正在索引的屬性具有特定值的一個或多個節點的引用。
以上是一個使用email
屬性作為鍵值指向節點的索引。
先通過下麵代碼添加數據。
try (Transaction tx = graphDb.beginTx()) { // 添加數據 Label label = Label.label("Student"); Node node1 = graphDb.createNode(label); node1.setProperty("name", "王翠花"); node1.setProperty("email", "[email protected]"); Node node2 = graphDb.createNode(label); node2.setProperty("name", "李小明"); node2.setProperty("email", "[email protected]"); Node node3 = graphDb.createNode(label); node3.setProperty("name", "楊小紅"); node3.setProperty("email", "[email protected]"); node1.createRelationshipTo(node2, RelTypes.IS_FRIEND_OF); node1.createRelationshipTo(node3, RelTypes.IS_FRIEND_OF); // 提交事務 tx.success(); }
通過Neo4j查看,添加成功。
下麵來創建索引。
Neo4j中使用IndexManager
來管理索引,然後通過索引標識符來訪問索引。
IndexManager indexManager = graphDb.index();
Index<Node> stuIndex = indexManager.forNodes("students");
上面個兩行代碼通過students
向索引管理器去請求獲得一個索引。
假如索引不存在則會自動創建。
因為是手動創建索引,所以還需要告訴資料庫要添加的屬性和對應的節點。
stuIndex.add(node1, "email", "[email protected]"); stuIndex.add(node2, "email", "[email protected]"); stuIndex.add(node3, "email", "[email protected]");
要添加一個節點到索引中,需要提供三個參數:需要索引的節點、索引鍵和索引的值。
索引創建好之後,來嘗試通過索引查找節點。
try (Transaction tx = graphDb.beginTx()) { String stuEmail = "[email protected]"; // 獲得索引 IndexManager indexManager = graphDb.index(); Index<Node> stuIndex = indexManager.forNodes("students"); // 獲得結果集 IndexHits<Node> indexHits = stuIndex.get("email", stuEmail); // getSingle()會返回唯一結果,不唯一的話返回null Node stu = indexHits.getSingle(); System.out.println(stu.getProperty("name", new String())); } //Output 王翠花
如果一個索引對應著多個節點,例如如果將年齡作為索引鍵,那麼會有多個學生節點有著相同的年齡。
這種情況迭代IndexHits
即可。有兩點需要註意:
- IndexHits是一次性迭代,不能重覆使用。
- 使用完IndexHits後應該關閉。如果所有結果都已迭代,IndexHits會自動關閉,否則需要調用close()方法手動關閉。
在關係資料庫中,如果更改有索引的數據,索引也會跟著自動更新。
但是對於Neo4j中採用手動方式創建的索引,Neo4j並不會隨著數據的改變而自動更新。
既然沒有這種機制,那麼只能採用一種笨方法,就是“先刪除後添加”等於“更新”。
刪除索引使用Index的remove()
方法。
try (Transaction tx = graphDb.beginTx()) { String stuEmail = "[email protected]"; // 獲得索引 IndexManager indexManager = graphDb.index(); Index<Node> stuIndex = indexManager.forNodes("students"); // 獲得要刪除索引對應的節點 Node stuNode = stuIndex.get("email", stuEmail).getSingle(); // 刪除索引 stuIndex.remove(stuNode, "email", stuNode.getProperty("email")); // 輸出 for (Node n : stuIndex.query("email", "*")) { System.out.println(n.getProperty("name")); }
} // Output 李小明 楊小紅
可以看到一個索引項已經刪除,這時重新對節點的屬性進行設置,然後調用索引的add()
方法就能完成手動的更新。
如果想刪除整個索引,使用delete()
方法。
indexManager.forNodes(indexName).delete();
相對於對節點建索引,關係索引很少用到,因為需要查詢的對象一般都是實體,也就是節點。
雖然可以手動創建和維護索引,但是感覺很麻煩,下麵介紹由資料庫自動創建和維護索引的方法。
模式索引
模式索引和關係資料庫中的索引很相似。
每一個索引會對應一個標簽和一組屬性。例如對學生的姓名name
進行索引,你只需要定義索引,資料庫會負責維護它們。
無論是更新還是刪除節點,索引都會自動更新或者刪除。
創建模式索引的方法如下:
IndexDefinition indexDefinition; try (Transaction tx = graphDb.beginTx()) { Schema schema = graphDb.schema(); indexDefinition = schema.indexFor(Label.label("Student")).on("name").create(); tx.success(); }
首先要獲取資料庫的模式,然後提供Label
和Property
就完成了索引的創建,比手動創建簡單了不少。
查詢也同樣簡單,使用ResourceIterator
存放結果集。
需要註意,如果ResourceIterator沒有完全迭代,則需要使用close()
方法手動關閉。
try (Transaction tx = graphDb.beginTx()) { ResourceIterator<Node> stus = graphDb.findNodes(Label.label("Student"), "name", "王翠花"); while (stus.hasNext()) { System.out.println(stus.next().getProperties("name", "email")); } tx.success(); }
輸出結果:
{name=王翠花, [email protected]}
刪除索引的方法:
try (Transaction tx = graphDb.beginTx()) { Label label = Label.label("Student"); for (IndexDefinition indexDefinition : graphDb.schema().getIndexes(label)) { // There is only one index indexDefinition.drop(); } tx.success(); }
自動索引
《Neo4j 實戰》這本書中的資料庫版本是2.x,書中提到了自動索引,一種通過配置文件來創建索引的方法。
但是在目前的3.x版本中已經廢棄,建議使用模式索引代替。
何時使用索引
《你知道資料庫索引的工作原理嗎》看完這篇文章,複習了關係資料庫中的索引,也對理解圖資料庫的索引有所幫助,因為兩者大同小異。
創建索引都是為了加快查找速度,但是索引的缺點就是會占用額外的磁碟空間,索引太多可能會導致磁碟空間不足,在進行插入和更新操作時也會影響性能。
下圖是使用索引和不使用索引查找搜索所有節點所需要的時間對比:
圖片來源:《Neo4j 實戰》
可以看到使用索引大大加快了查找速度。但是有時在查詢上提高的性能可能會被抵消。
下圖顯示了隨著節點數量的增加,創建一個新節點所需的時間,有索引情況下需要的時間差不多是無索引的兩倍。
圖片來源:《Neo4j 實戰》
所以在創建索引時要有所權衡,對於那寫頻繁更新和創建的數據要謹慎選擇索引。
轉載請註明原文鏈接:http://www.cnblogs.com/justcooooode/p/8182376.html
參考資料
https://neo4j.com/docs/java-reference/3.2/#tutorials-java-embedded-index
《Neo4j 實戰》