Django筆記十一之外鍵查詢優化select_related和prefetch_related

来源:https://www.cnblogs.com/hunterxiong/archive/2023/03/29/17270664.html
-Advertisement-
Play Games

點右上角加星標,江湖要事早知道 前幾天在脈脈上看到一個熱議話題“23年找工作的心酸歷程” 大家都知道近幾年互聯網大環境不好,找工作變得越來越捲了、 就算是BAT這種大廠出來的,也不見得就有多好找工作,可想而知,如果你的背景和能力不是特別強,很有可能練簡歷關都過不了。 特別是工作時間久的老程式員,總包 ...


本篇筆記目錄如下:

  1. select_related
  2. prefetch_related

在介紹 select_related 和 prefetch_related 這兩個函數前,我們先來看一個例子。

對於,Entry 和 Blog 這兩個 model,前面介紹過,Blog 是 Entry 的外鍵,如下:

class Blog(models.Model):
    name = models.CharField(max_length=100)
    tagline = models.TextField()


class Entry(models.Model):
    blog = models.ForeignKey(Blog, on_delete=models.CASCADE)
    headline = models.CharField(max_length=255)
    body_text = models.TextField()
    pub_date = models.DateField()
    mod_date = models.DateField()
    authors = models.ManyToManyField(Author)
    number_of_comments = models.IntegerField()
    number_of_pingbacks = models.IntegerField()
    rating = models.IntegerField()

比如我們需要獲取 Entry 的前十條數據,然後列印出關聯的 Blog 的 name 欄位信息。

我們一般會如此操作:

for entry in Entry.objects.all()[:10]
	if entry.blog:
		print(entry.blog.name)
	else:
		print("沒有關聯 blog 數據")

但是這樣會有一個問題,那就是,這個 for 迴圈的操作會查詢數據十一次,一次查詢 Entry 數據,十次是查詢每個 entry_obj 關聯的 blog 數據。

這個設計對於系統來說是不合理的,想一想如果我們查詢的數據是一千條,一萬條,無論是系統介面的等待時間,還是資料庫的訪問壓力,都是不可接受的。

因此我們可以引入 外鍵 和 ManyToManyTo 的一種能夠減少資料庫的訪問次數的方式:select_related,prefetch_related。

當我們在使用的時候,如果有需要獲取的外鍵數據,比如 Entry 關聯的 Blog 數據,則可以將其欄位名作為參數傳入,這樣在獲取數據的時候就可以一次性將所有關聯的 Blog 數據也取出來,而不用單獨再去查詢一遍資料庫。

如下,批量操作

for entry in Entry.objects.select_related("blog").all():
	print(e.blog)  # 這個操作不會額外再去查詢資料庫

當然也適用於單條數據

e = Entry.objects.get(id=5).select_related("blog")

為了驗證 select_related() 確實會只查詢一遍資料庫,有兩種方法:
一種是在資料庫層面列印出來所有查詢的 SQL語句,
另一種可以從側面表示,那就是在系統層面列印出我們的查詢條件轉化的 SQL 語句。

比如:

Entry.objects.select_related("blog").all().query.__str__()

可以看到會輸出一個 關聯了 Blog 表的 inner join 的 SQL 語句。

SELECT `blog_entry`.`id`, `blog_entry`.`blog_id`, `blog_entry`.`headline`, `blog_entry`.`body_text`, `blog_entry`.`pub_date`, `blog_entry`.`mod_date`, `blog_entry`.`number_of_comments`, `blog_entry`.`number_of_pingbacks`, `blog_entry`.`rating`, `blog_blog`.`id`, `blog_blog`.`name`, `blog_blog`.`tagline` FROM `blog_entry` INNER JOIN `blog_blog` ON (`blog_entry`.`blog_id` = `blog_blog`.`id`)

鏈式獲取外鍵數據

比如下麵的 model:

class City(models.Model):
    pass


class Person(models.Model):
    hometown = models.ForeignKey(
        City, on_delete=models.SET_NULL, blank=True, null=True)


class Book(models.Model):
    author = models.ForeignKey(Person, on_delete=models.CASCADE)

我們可以通過以下語句來將 Book 關聯的 Person,以及該條 Person 數據關聯的 City 數據一起查詢出來:

book = Book.objects.select_related("author__hometown").get(id=4)
person = book.author
city = person.hometown

因為我們在第一步查詢的時候,通過雙下劃線將兩個外鍵欄位連接在一起取了出來,所以在第二步和第三步取 Person 數據和 City 數據的時候,就不需要再次查詢資料庫了。

同時獲取多個外鍵關聯欄位

如果一個 model 有兩個外鍵欄位 foo 和 bar,那麼下麵的兩種寫法都將這兩個外鍵欄位關聯取出:

select_related("foo", "bar")
select_related("foo").select_related("bar")

需要註意的是,這個鏈式的操作和 order_by() 的結果是不一樣的哦,前面提到的 order_by() 的鏈式操作會導致後面的覆蓋前面的,但是取外鍵數據的時候會同時取出。

註意: select_related() 僅作用於 ForeignKey 和 OneToOne,如果是 ManyToMany 欄位,則需要用到下麵的 prefetch_related() 函數。

prefetch_related() 和 select_related() 作用類似,都是通過減少查詢的次數,來實現查詢優化。

但 prefetch_related() 是針對 ManyToMany 的操作。

舉個例子:

from django.db import models


class Topping(models.Model):
    name = models.CharField(max_length=30)


class Pizza(models.Model):
    name = models.CharField(max_length=50)
    toppings = models.ManyToManyField(Topping)


    def __str__(self):
        return "%s (%s)" % (
            self.name,
            ", ".join(topping.name for topping in self.toppings.all()),
        )

當我們執行:

Pizza.objects.all()

的時候,因為每一條 Pizza 數據實例化的時候,都會調用 str() 函數,而這個函數會再次去請求一遍資料庫,所以多條 Pizza 數據會導致查詢多次資料庫。

因為我們可以使用 prefetch_related() 函數來達到減少查詢的目的:

Pizza.objects.prefetch_related('toppings').all()

這樣的話,對資料庫的查詢會減少到兩次,一次是查詢出所有的 Pizza 數據,一次是根據所有的 pizza_id 找到所有關聯的 topping 數據。

如果有興趣,可以比對下麵兩條語句在 shell 中執行的時候,MySQL 伺服器接收到的 SQL 查詢語句:

Pizza.objects.all()

Pizza.objects.prefetch_related('toppings').all()

下麵一種情況需要註意哦:

pizzas = Pizza.objects.prefetch_related('toppings')
[list(pizza.toppings.filter(spicy=True)) for pizza in pizzas]

因為第二步操作里,會對 toppings 數據進行一次新的 filter 過濾操作,所以會導致每次該語句重新去查詢資料庫,也就是說,我們的 prefetch_related() 操作是失效的。

以上就是本篇筆記全部內容,接下來會介紹查詢里的 defer 和 only 函數。

本文首發於本人微信公眾號:Django筆記。

原文鏈接:Django筆記十一之外鍵查詢優化select_related和prefetch_related

如果想獲取更多相關文章,可掃碼關註閱讀:
image


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 定義 觀察者模式屬於行為型模式,它定義了對象間的一種一對多的依賴關係,當一個對象的狀態發生改變時,所有依賴於它的對象都將得到通知,並自動更新。 一種一對多的關係中一稱為被觀察者也叫目標對象Subject而多則稱為觀察者對象Observer 觀察者模式中通常有兩個模型,一個觀察者(observer)和 ...
  • UML 類圖 1 類圖的結構 用動物園的類圖結構來舉例,先抽象化動物類如圖所示: 一個類圖包括類名、屬性和行為,類名不用解釋,在介紹屬性和行為前,先瞭解一下訪問許可權: ‘ - ’ private:只有類內部的成員才能訪問 ‘ + ’ public:類內部和類外部都能訪問 ‘ # ’ protecte ...
  • XSS攻擊是什麼? XSS攻擊是指攻擊者利用網站中的漏洞,向頁面中註入惡意腳本,從而獲取用戶的信息或者控制用戶的電腦。 舉一個通俗的例子,早期使用JSP頁面渲染頁面的項目,如果將用戶名改成nick<alert>1</alert>,則當用戶打開頁面時,就會彈出一個警告框,而這個警告框可以被惡意腳本所 ...
  • 使用 VLD 記憶體泄漏檢測工具輔助開發時整理的學習筆記。本篇介紹 VLD 配置文件中配置項 SkipHeapFreeLeaks 的使用方法。 ...
  • 文章目錄 限流基本概念 QPS和連接數控制 傳輸速率 黑白名單 分散式環境 限流方案常用演算法 令牌桶演算法 漏桶演算法 滑動視窗 常用的限流方案 Nginx限流 中間件限流 限流組件 合法性驗證限流 Guava限流 網關層限流 從架構維度考慮限流設計 具體的實現限流的手段: Tomcat限流 限流基本概 ...
  • 1.魔法函數 python中常見的內置類型 什麼是魔法函數? python的魔法函數總被雙下劃線包圍,它們可以給你的類增加特殊的方法。如果你的對象實現了這些方法中的一個,那麼這個方法就會在特殊情況下被調用,你可以定義想要 的行為,而這一切都是自動發生的。 魔法函數一覽 魔法函數舉例 1.1.__ge ...
  • 使用 VLD 記憶體泄漏檢測工具輔助開發時整理的學習筆記。本篇介紹 VLD 配置文件中配置項 TraceInternalFrames 的使用方法。 ...
  • 分數 20 本題要求你從任意給定的兩個 1 位數字 a1​ 和 a2​ 開始,用乘法口訣生成一個數列 {an​},規則為從 a1​ 開始順次進行,每次將當前數字與後面一個數字相乘,將結果貼在數列末尾。如果結果不是 1 位數,則其每一位都應成為數列的一項。 輸入格式: 輸入在一行中給出 3 個整數,依 ...
一周排行
    -Advertisement-
    Play Games
  • 概述:在C#中,++i和i++都是自增運算符,其中++i先增加值再返回,而i++先返回值再增加。應用場景根據需求選擇,首碼適合先增後用,尾碼適合先用後增。詳細示例提供清晰的代碼演示這兩者的操作時機和實際應用。 在C#中,++i 和 i++ 都是自增運算符,但它們在操作上有細微的差異,主要體現在操作的 ...
  • 上次發佈了:Taurus.MVC 性能壓力測試(ap 壓測 和 linux 下wrk 壓測):.NET Core 版本,今天計劃準備壓測一下 .NET 版本,來測試並記錄一下 Taurus.MVC 框架在 .NET 版本的性能,以便後續持續優化改進。 為了方便對比,本文章的電腦環境和測試思路,儘量和... ...
  • .NET WebAPI作為一種構建RESTful服務的強大工具,為開發者提供了便捷的方式來定義、處理HTTP請求並返迴響應。在設計API介面時,正確地接收和解析客戶端發送的數據至關重要。.NET WebAPI提供了一系列特性,如[FromRoute]、[FromQuery]和[FromBody],用 ...
  • 原因:我之所以想做這個項目,是因為在之前查找關於C#/WPF相關資料時,我發現講解圖像濾鏡的資源非常稀缺。此外,我註意到許多現有的開源庫主要基於CPU進行圖像渲染。這種方式在處理大量圖像時,會導致CPU的渲染負擔過重。因此,我將在下文中介紹如何通過GPU渲染來有效實現圖像的各種濾鏡效果。 生成的效果 ...
  • 引言 上一章我們介紹了在xUnit單元測試中用xUnit.DependencyInject來使用依賴註入,上一章我們的Sample.Repository倉儲層有一個批量註入的介面沒有做單元測試,今天用這個示例來演示一下如何用Bogus創建模擬數據 ,和 EFCore 的種子數據生成 Bogus 的優 ...
  • 一、前言 在自己的項目中,涉及到實時心率曲線的繪製,項目上的曲線繪製,一般很難找到能直接用的第三方庫,而且有些還是定製化的功能,所以還是自己繪製比較方便。很多人一聽到自己畫就害怕,感覺很難,今天就分享一個完整的實時心率數據繪製心率曲線圖的例子;之前的博客也分享給DrawingVisual繪製曲線的方 ...
  • 如果你在自定義的 Main 方法中直接使用 App 類並啟動應用程式,但發現 App.xaml 中定義的資源沒有被正確載入,那麼問題可能在於如何正確配置 App.xaml 與你的 App 類的交互。 確保 App.xaml 文件中的 x:Class 屬性正確指向你的 App 類。這樣,當你創建 Ap ...
  • 一:背景 1. 講故事 上個月有個朋友在微信上找到我,說他們的軟體在客戶那邊隔幾天就要崩潰一次,一直都沒有找到原因,讓我幫忙看下怎麼回事,確實工控類的軟體環境複雜難搞,朋友手上有一個崩潰的dump,剛好丟給我來分析一下。 二:WinDbg分析 1. 程式為什麼會崩潰 windbg 有一個厲害之處在於 ...
  • 前言 .NET生態中有許多依賴註入容器。在大多數情況下,微軟提供的內置容器在易用性和性能方面都非常優秀。外加ASP.NET Core預設使用內置容器,使用很方便。 但是筆者在使用中一直有一個頭疼的問題:服務工廠無法提供請求的服務類型相關的信息。這在一般情況下並沒有影響,但是內置容器支持註冊開放泛型服 ...
  • 一、前言 在項目開發過程中,DataGrid是經常使用到的一個數據展示控制項,而通常表格的最後一列是作為操作列存在,比如會有編輯、刪除等功能按鈕。但WPF的原始DataGrid中,預設只支持固定左側列,這跟大家習慣性操作列放最後不符,今天就來介紹一種簡單的方式實現固定右側列。(這裡的實現方式參考的大佬 ...