Django筆記十一之外鍵查詢優化select_related和prefetch_related

-Advertisement-

點右上角加星標，江湖要事早知道前幾天在脈脈上看到一個熱議話題“23年找工作的心酸歷程” 大家都知道近幾年互聯網大環境不好，找工作變得越來越捲了、就算是BAT這種大廠出來的，也不見得就有多好找工作，可想而知，如果你的背景和能力不是特別強，很有可能練簡歷關都過不了。特別是工作時間久的老程式員，總包 ...

本篇筆記目錄如下：

select_related
prefetch_related

在介紹 select_related 和 prefetch_related 這兩個函數前，我們先來看一個例子。

對於，Entry 和 Blog 這兩個 model，前面介紹過，Blog 是 Entry 的外鍵，如下：

class Blog(models.Model):
    name = models.CharField(max_length=100)
    tagline = models.TextField()


class Entry(models.Model):
    blog = models.ForeignKey(Blog, on_delete=models.CASCADE)
    headline = models.CharField(max_length=255)
    body_text = models.TextField()
    pub_date = models.DateField()
    mod_date = models.DateField()
    authors = models.ManyToManyField(Author)
    number_of_comments = models.IntegerField()
    number_of_pingbacks = models.IntegerField()
    rating = models.IntegerField()

比如我們需要獲取 Entry 的前十條數據，然後列印出關聯的 Blog 的 name 欄位信息。

我們一般會如此操作：

for entry in Entry.objects.all()[:10]
	if entry.blog:
		print(entry.blog.name)
	else:
		print("沒有關聯 blog 數據")

但是這樣會有一個問題，那就是，這個 for 迴圈的操作會查詢數據十一次，一次查詢 Entry 數據，十次是查詢每個 entry_obj 關聯的 blog 數據。

這個設計對於系統來說是不合理的，想一想如果我們查詢的數據是一千條，一萬條，無論是系統介面的等待時間，還是資料庫的訪問壓力，都是不可接受的。

因此我們可以引入外鍵和 ManyToManyTo 的一種能夠減少資料庫的訪問次數的方式：select_related，prefetch_related。

select_related

當我們在使用的時候，如果有需要獲取的外鍵數據，比如 Entry 關聯的 Blog 數據，則可以將其欄位名作為參數傳入，這樣在獲取數據的時候就可以一次性將所有關聯的 Blog 數據也取出來，而不用單獨再去查詢一遍資料庫。

如下，批量操作：

for entry in Entry.objects.select_related("blog").all():
	print(e.blog)  # 這個操作不會額外再去查詢資料庫

當然也適用於單條數據：

e = Entry.objects.get(id=5).select_related("blog")

為了驗證 select_related() 確實會只查詢一遍資料庫，有兩種方法：
一種是在資料庫層面列印出來所有查詢的 SQL語句，
另一種可以從側面表示，那就是在系統層面列印出我們的查詢條件轉化的 SQL 語句。

比如：

Entry.objects.select_related("blog").all().query.__str__()

可以看到會輸出一個關聯了 Blog 表的 inner join 的 SQL 語句。

SELECT `blog_entry`.`id`, `blog_entry`.`blog_id`, `blog_entry`.`headline`, `blog_entry`.`body_text`, `blog_entry`.`pub_date`, `blog_entry`.`mod_date`, `blog_entry`.`number_of_comments`, `blog_entry`.`number_of_pingbacks`, `blog_entry`.`rating`, `blog_blog`.`id`, `blog_blog`.`name`, `blog_blog`.`tagline` FROM `blog_entry` INNER JOIN `blog_blog` ON (`blog_entry`.`blog_id` = `blog_blog`.`id`)

鏈式獲取外鍵數據

比如下麵的 model：

class City(models.Model):
    pass


class Person(models.Model):
    hometown = models.ForeignKey(
        City, on_delete=models.SET_NULL, blank=True, null=True)


class Book(models.Model):
    author = models.ForeignKey(Person, on_delete=models.CASCADE)

我們可以通過以下語句來將 Book 關聯的 Person，以及該條 Person 數據關聯的 City 數據一起查詢出來：

book = Book.objects.select_related("author__hometown").get(id=4)
person = book.author
city = person.hometown

因為我們在第一步查詢的時候，通過雙下劃線將兩個外鍵欄位連接在一起取了出來，所以在第二步和第三步取 Person 數據和 City 數據的時候，就不需要再次查詢資料庫了。

同時獲取多個外鍵關聯欄位

如果一個 model 有兩個外鍵欄位 foo 和 bar，那麼下麵的兩種寫法都將這兩個外鍵欄位關聯取出：

select_related("foo", "bar")
select_related("foo").select_related("bar")

需要註意的是，這個鏈式的操作和 order_by() 的結果是不一樣的哦，前面提到的 order_by() 的鏈式操作會導致後面的覆蓋前面的，但是取外鍵數據的時候會同時取出。

註意： select_related() 僅作用於 ForeignKey 和 OneToOne，如果是 ManyToMany 欄位，則需要用到下麵的 prefetch_related() 函數。

prefetch_related()

prefetch_related() 和 select_related() 作用類似，都是通過減少查詢的次數，來實現查詢優化。

但 prefetch_related() 是針對 ManyToMany 的操作。

舉個例子：

from django.db import models


class Topping(models.Model):
    name = models.CharField(max_length=30)


class Pizza(models.Model):
    name = models.CharField(max_length=50)
    toppings = models.ManyToManyField(Topping)


    def __str__(self):
        return "%s (%s)" % (
            self.name,
            ", ".join(topping.name for topping in self.toppings.all()),
        )

當我們執行：

Pizza.objects.all()

的時候，因為每一條 Pizza 數據實例化的時候，都會調用 str() 函數，而這個函數會再次去請求一遍資料庫，所以多條 Pizza 數據會導致查詢多次資料庫。

因為我們可以使用 prefetch_related() 函數來達到減少查詢的目的：

Pizza.objects.prefetch_related('toppings').all()

這樣的話，對資料庫的查詢會減少到兩次，一次是查詢出所有的 Pizza 數據，一次是根據所有的 pizza_id 找到所有關聯的 topping 數據。

如果有興趣，可以比對下麵兩條語句在 shell 中執行的時候，MySQL 伺服器接收到的 SQL 查詢語句：

Pizza.objects.all()

Pizza.objects.prefetch_related('toppings').all()

下麵一種情況需要註意哦：

pizzas = Pizza.objects.prefetch_related('toppings')
[list(pizza.toppings.filter(spicy=True)) for pizza in pizzas]

因為第二步操作里，會對 toppings 數據進行一次新的 filter 過濾操作，所以會導致每次該語句重新去查詢資料庫，也就是說，我們的 prefetch_related() 操作是失效的。

以上就是本篇筆記全部內容，接下來會介紹查詢里的 defer 和 only 函數。

本文首發於本人微信公眾號：Django筆記。

原文鏈接：Django筆記十一之外鍵查詢優化select_related和prefetch_related

如果想獲取更多相關文章，可掃碼關註閱讀：

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

行為型：觀察者模式

定義觀察者模式屬於行為型模式，它定義了對象間的一種一對多的依賴關係，當一個對象的狀態發生改變時，所有依賴於它的對象都將得到通知，並自動更新。一種一對多的關係中一稱為被觀察者也叫目標對象Subject而多則稱為觀察者對象Observer 觀察者模式中通常有兩個模型，一個觀察者（observer）和 ...
UML 類圖

UML 類圖 1 類圖的結構用動物園的類圖結構來舉例，先抽象化動物類如圖所示：一個類圖包括類名、屬性和行為，類名不用解釋，在介紹屬性和行為前，先瞭解一下訪問許可權： ‘ - ’ private：只有類內部的成員才能訪問 ‘ + ’ public：類內部和類外部都能訪問 ‘ # ’ protecte ...
聊聊微服務架構思想

XSS攻擊是什麼？ XSS攻擊是指攻擊者利用網站中的漏洞，向頁面中註入惡意腳本，從而獲取用戶的信息或者控制用戶的電腦。舉一個通俗的例子，早期使用JSP頁面渲染頁面的項目，如果將用戶名改成nick<alert>1</alert>，則當用戶打開頁面時，就會彈出一個警告框，而這個警告框可以被惡意腳本所 ...
【Visual Leak Detector】配置項 SkipHeapFreeLeaks

使用 VLD 記憶體泄漏檢測工具輔助開發時整理的學習筆記。本篇介紹 VLD 配置文件中配置項 SkipHeapFreeLeaks 的使用方法。 ...
限流的幾種方案

文章目錄限流基本概念 QPS和連接數控制傳輸速率黑白名單分散式環境限流方案常用演算法令牌桶演算法漏桶演算法滑動視窗常用的限流方案 Nginx限流中間件限流限流組件合法性驗證限流 Guava限流網關層限流從架構維度考慮限流設計具體的實現限流的手段： Tomcat限流限流基本概 ...
Python面向對象-高級用法

1.魔法函數 python中常見的內置類型什麼是魔法函數？ python的魔法函數總被雙下劃線包圍，它們可以給你的類增加特殊的方法。如果你的對象實現了這些方法中的一個，那麼這個方法就會在特殊情況下被調用，你可以定義想要的行為，而這一切都是自動發生的。魔法函數一覽魔法函數舉例 1.1.__ge ...
【Visual Leak Detector】配置項 TraceInternalFrames

使用 VLD 記憶體泄漏檢測工具輔助開發時整理的學習筆記。本篇介紹 VLD 配置文件中配置項 TraceInternalFrames 的使用方法。 ...
L1-080 乘法口訣數列*(使用C++)

分數 20 本題要求你從任意給定的兩個 1 位數字 a1 和 a2 開始，用乘法口訣生成一個數列 {an}，規則為從 a1 開始順次進行，每次將當前數字與後面一個數字相乘，將結果貼在數列末尾。如果結果不是 1 位數，則其每一位都應成為數列的一項。輸入格式：輸入在一行中給出 3 個整數，依 ...