Django筆記十一之外鍵查詢優化select_related和prefetch_related

来源:https://www.cnblogs.com/hunterxiong/archive/2023/03/29/17270664.html
-Advertisement-
Play Games

點右上角加星標,江湖要事早知道 前幾天在脈脈上看到一個熱議話題“23年找工作的心酸歷程” 大家都知道近幾年互聯網大環境不好,找工作變得越來越捲了、 就算是BAT這種大廠出來的,也不見得就有多好找工作,可想而知,如果你的背景和能力不是特別強,很有可能練簡歷關都過不了。 特別是工作時間久的老程式員,總包 ...


本篇筆記目錄如下:

  1. select_related
  2. prefetch_related

在介紹 select_related 和 prefetch_related 這兩個函數前,我們先來看一個例子。

對於,Entry 和 Blog 這兩個 model,前面介紹過,Blog 是 Entry 的外鍵,如下:

class Blog(models.Model):
    name = models.CharField(max_length=100)
    tagline = models.TextField()


class Entry(models.Model):
    blog = models.ForeignKey(Blog, on_delete=models.CASCADE)
    headline = models.CharField(max_length=255)
    body_text = models.TextField()
    pub_date = models.DateField()
    mod_date = models.DateField()
    authors = models.ManyToManyField(Author)
    number_of_comments = models.IntegerField()
    number_of_pingbacks = models.IntegerField()
    rating = models.IntegerField()

比如我們需要獲取 Entry 的前十條數據,然後列印出關聯的 Blog 的 name 欄位信息。

我們一般會如此操作:

for entry in Entry.objects.all()[:10]
	if entry.blog:
		print(entry.blog.name)
	else:
		print("沒有關聯 blog 數據")

但是這樣會有一個問題,那就是,這個 for 迴圈的操作會查詢數據十一次,一次查詢 Entry 數據,十次是查詢每個 entry_obj 關聯的 blog 數據。

這個設計對於系統來說是不合理的,想一想如果我們查詢的數據是一千條,一萬條,無論是系統介面的等待時間,還是資料庫的訪問壓力,都是不可接受的。

因此我們可以引入 外鍵 和 ManyToManyTo 的一種能夠減少資料庫的訪問次數的方式:select_related,prefetch_related。

當我們在使用的時候,如果有需要獲取的外鍵數據,比如 Entry 關聯的 Blog 數據,則可以將其欄位名作為參數傳入,這樣在獲取數據的時候就可以一次性將所有關聯的 Blog 數據也取出來,而不用單獨再去查詢一遍資料庫。

如下,批量操作

for entry in Entry.objects.select_related("blog").all():
	print(e.blog)  # 這個操作不會額外再去查詢資料庫

當然也適用於單條數據

e = Entry.objects.get(id=5).select_related("blog")

為了驗證 select_related() 確實會只查詢一遍資料庫,有兩種方法:
一種是在資料庫層面列印出來所有查詢的 SQL語句,
另一種可以從側面表示,那就是在系統層面列印出我們的查詢條件轉化的 SQL 語句。

比如:

Entry.objects.select_related("blog").all().query.__str__()

可以看到會輸出一個 關聯了 Blog 表的 inner join 的 SQL 語句。

SELECT `blog_entry`.`id`, `blog_entry`.`blog_id`, `blog_entry`.`headline`, `blog_entry`.`body_text`, `blog_entry`.`pub_date`, `blog_entry`.`mod_date`, `blog_entry`.`number_of_comments`, `blog_entry`.`number_of_pingbacks`, `blog_entry`.`rating`, `blog_blog`.`id`, `blog_blog`.`name`, `blog_blog`.`tagline` FROM `blog_entry` INNER JOIN `blog_blog` ON (`blog_entry`.`blog_id` = `blog_blog`.`id`)

鏈式獲取外鍵數據

比如下麵的 model:

class City(models.Model):
    pass


class Person(models.Model):
    hometown = models.ForeignKey(
        City, on_delete=models.SET_NULL, blank=True, null=True)


class Book(models.Model):
    author = models.ForeignKey(Person, on_delete=models.CASCADE)

我們可以通過以下語句來將 Book 關聯的 Person,以及該條 Person 數據關聯的 City 數據一起查詢出來:

book = Book.objects.select_related("author__hometown").get(id=4)
person = book.author
city = person.hometown

因為我們在第一步查詢的時候,通過雙下劃線將兩個外鍵欄位連接在一起取了出來,所以在第二步和第三步取 Person 數據和 City 數據的時候,就不需要再次查詢資料庫了。

同時獲取多個外鍵關聯欄位

如果一個 model 有兩個外鍵欄位 foo 和 bar,那麼下麵的兩種寫法都將這兩個外鍵欄位關聯取出:

select_related("foo", "bar")
select_related("foo").select_related("bar")

需要註意的是,這個鏈式的操作和 order_by() 的結果是不一樣的哦,前面提到的 order_by() 的鏈式操作會導致後面的覆蓋前面的,但是取外鍵數據的時候會同時取出。

註意: select_related() 僅作用於 ForeignKey 和 OneToOne,如果是 ManyToMany 欄位,則需要用到下麵的 prefetch_related() 函數。

prefetch_related() 和 select_related() 作用類似,都是通過減少查詢的次數,來實現查詢優化。

但 prefetch_related() 是針對 ManyToMany 的操作。

舉個例子:

from django.db import models


class Topping(models.Model):
    name = models.CharField(max_length=30)


class Pizza(models.Model):
    name = models.CharField(max_length=50)
    toppings = models.ManyToManyField(Topping)


    def __str__(self):
        return "%s (%s)" % (
            self.name,
            ", ".join(topping.name for topping in self.toppings.all()),
        )

當我們執行:

Pizza.objects.all()

的時候,因為每一條 Pizza 數據實例化的時候,都會調用 str() 函數,而這個函數會再次去請求一遍資料庫,所以多條 Pizza 數據會導致查詢多次資料庫。

因為我們可以使用 prefetch_related() 函數來達到減少查詢的目的:

Pizza.objects.prefetch_related('toppings').all()

這樣的話,對資料庫的查詢會減少到兩次,一次是查詢出所有的 Pizza 數據,一次是根據所有的 pizza_id 找到所有關聯的 topping 數據。

如果有興趣,可以比對下麵兩條語句在 shell 中執行的時候,MySQL 伺服器接收到的 SQL 查詢語句:

Pizza.objects.all()

Pizza.objects.prefetch_related('toppings').all()

下麵一種情況需要註意哦:

pizzas = Pizza.objects.prefetch_related('toppings')
[list(pizza.toppings.filter(spicy=True)) for pizza in pizzas]

因為第二步操作里,會對 toppings 數據進行一次新的 filter 過濾操作,所以會導致每次該語句重新去查詢資料庫,也就是說,我們的 prefetch_related() 操作是失效的。

以上就是本篇筆記全部內容,接下來會介紹查詢里的 defer 和 only 函數。

本文首發於本人微信公眾號:Django筆記。

原文鏈接:Django筆記十一之外鍵查詢優化select_related和prefetch_related

如果想獲取更多相關文章,可掃碼關註閱讀:
image


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 定義 觀察者模式屬於行為型模式,它定義了對象間的一種一對多的依賴關係,當一個對象的狀態發生改變時,所有依賴於它的對象都將得到通知,並自動更新。 一種一對多的關係中一稱為被觀察者也叫目標對象Subject而多則稱為觀察者對象Observer 觀察者模式中通常有兩個模型,一個觀察者(observer)和 ...
  • UML 類圖 1 類圖的結構 用動物園的類圖結構來舉例,先抽象化動物類如圖所示: 一個類圖包括類名、屬性和行為,類名不用解釋,在介紹屬性和行為前,先瞭解一下訪問許可權: ‘ - ’ private:只有類內部的成員才能訪問 ‘ + ’ public:類內部和類外部都能訪問 ‘ # ’ protecte ...
  • XSS攻擊是什麼? XSS攻擊是指攻擊者利用網站中的漏洞,向頁面中註入惡意腳本,從而獲取用戶的信息或者控制用戶的電腦。 舉一個通俗的例子,早期使用JSP頁面渲染頁面的項目,如果將用戶名改成nick<alert>1</alert>,則當用戶打開頁面時,就會彈出一個警告框,而這個警告框可以被惡意腳本所 ...
  • 使用 VLD 記憶體泄漏檢測工具輔助開發時整理的學習筆記。本篇介紹 VLD 配置文件中配置項 SkipHeapFreeLeaks 的使用方法。 ...
  • 文章目錄 限流基本概念 QPS和連接數控制 傳輸速率 黑白名單 分散式環境 限流方案常用演算法 令牌桶演算法 漏桶演算法 滑動視窗 常用的限流方案 Nginx限流 中間件限流 限流組件 合法性驗證限流 Guava限流 網關層限流 從架構維度考慮限流設計 具體的實現限流的手段: Tomcat限流 限流基本概 ...
  • 1.魔法函數 python中常見的內置類型 什麼是魔法函數? python的魔法函數總被雙下劃線包圍,它們可以給你的類增加特殊的方法。如果你的對象實現了這些方法中的一個,那麼這個方法就會在特殊情況下被調用,你可以定義想要 的行為,而這一切都是自動發生的。 魔法函數一覽 魔法函數舉例 1.1.__ge ...
  • 使用 VLD 記憶體泄漏檢測工具輔助開發時整理的學習筆記。本篇介紹 VLD 配置文件中配置項 TraceInternalFrames 的使用方法。 ...
  • 分數 20 本題要求你從任意給定的兩個 1 位數字 a1​ 和 a2​ 開始,用乘法口訣生成一個數列 {an​},規則為從 a1​ 開始順次進行,每次將當前數字與後面一個數字相乘,將結果貼在數列末尾。如果結果不是 1 位數,則其每一位都應成為數列的一項。 輸入格式: 輸入在一行中給出 3 個整數,依 ...
一周排行
    -Advertisement-
    Play Games
  • Timer是什麼 Timer 是一種用於創建定期粒度行為的機制。 與標準的 .NET System.Threading.Timer 類相似,Orleans 的 Timer 允許在一段時間後執行特定的操作,或者在特定的時間間隔內重覆執行操作。 它在分散式系統中具有重要作用,特別是在處理需要周期性執行的 ...
  • 前言 相信很多做WPF開發的小伙伴都遇到過表格類的需求,雖然現有的Grid控制項也能實現,但是使用起來的體驗感並不好,比如要實現一個Excel中的表格效果,估計你能想到的第一個方法就是套Border控制項,用這種方法你需要控制每個Border的邊框,並且在一堆Bordr中找到Grid.Row,Grid. ...
  • .NET C#程式啟動閃退,目錄導致的問題 這是第2次踩這個坑了,很小的編程細節,容易忽略,所以寫個博客,分享給大家。 1.第一次坑:是windows 系統把程式運行成服務,找不到配置文件,原因是以服務運行它的工作目錄是在C:\Windows\System32 2.本次坑:WPF桌面程式通過註冊表設 ...
  • 在分散式系統中,數據的持久化是至關重要的一環。 Orleans 7 引入了強大的持久化功能,使得在分散式環境下管理數據變得更加輕鬆和可靠。 本文將介紹什麼是 Orleans 7 的持久化,如何設置它以及相應的代碼示例。 什麼是 Orleans 7 的持久化? Orleans 7 的持久化是指將 Or ...
  • 前言 .NET Feature Management 是一個用於管理應用程式功能的庫,它可以幫助開發人員在應用程式中輕鬆地添加、移除和管理功能。使用 Feature Management,開發人員可以根據不同用戶、環境或其他條件來動態地控制應用程式中的功能。這使得開發人員可以更靈活地管理應用程式的功 ...
  • 在 WPF 應用程式中,拖放操作是實現用戶交互的重要組成部分。通過拖放操作,用戶可以輕鬆地將數據從一個位置移動到另一個位置,或者將控制項從一個容器移動到另一個容器。然而,WPF 中預設的拖放操作可能並不是那麼好用。為瞭解決這個問題,我們可以自定義一個 Panel 來實現更簡單的拖拽操作。 自定義 Pa ...
  • 在實際使用中,由於涉及到不同編程語言之間互相調用,導致C++ 中的OpenCV與C#中的OpenCvSharp 圖像數據在不同編程語言之間難以有效傳遞。在本文中我們將結合OpenCvSharp源碼實現原理,探究兩種數據之間的通信方式。 ...
  • 一、前言 這是一篇搭建許可權管理系統的系列文章。 隨著網路的發展,信息安全對應任何企業來說都越發的重要,而本系列文章將和大家一起一步一步搭建一個全新的許可權管理系統。 說明:由於搭建一個全新的項目過於繁瑣,所有作者將挑選核心代碼和核心思路進行分享。 二、技術選擇 三、開始設計 1、自主搭建vue前端和. ...
  • Csharper中的表達式樹 這節課來瞭解一下表示式樹是什麼? 在C#中,表達式樹是一種數據結構,它可以表示一些代碼塊,如Lambda表達式或查詢表達式。表達式樹使你能夠查看和操作數據,就像你可以查看和操作代碼一樣。它們通常用於創建動態查詢和解析表達式。 一、認識表達式樹 為什麼要這樣說?它和委托有 ...
  • 在使用Django等框架來操作MySQL時,實際上底層還是通過Python來操作的,首先需要安裝一個驅動程式,在Python3中,驅動程式有多種選擇,比如有pymysql以及mysqlclient等。使用pip命令安裝mysqlclient失敗應如何解決? 安裝的python版本說明 機器同時安裝了 ...