為什麼文件刪除了但磁碟空間沒有釋放?

来源:https://www.cnblogs.com/edisonfish/archive/2023/03/18/17229472.html
-Advertisement-
Play Games

案例現象 這天,監控系統發來一條告警消息,內容說某台伺服器根目錄磁碟占用空間達到閾值,超過百分之八十了 登上伺服器,df -Th 看一下,發現磁碟空間確實不夠用了 進入到根目錄,然後 du -sh * 可以看到,var 目錄下的磁碟空間已經占用了 75G 既然如此,刪除 var 目錄下一些占空間較大 ...


案例現象

這天,監控系統發來一條告警消息,內容說某台伺服器根目錄磁碟占用空間達到閾值,超過百分之八十了

 

登上伺服器,df -Th 看一下,發現磁碟空間確實不夠用了

 

 

 

 

進入到根目錄,然後 du -sh *

 

 

 

可以看到,var 目錄下的磁碟空間已經占用了 75G

 

 

既然如此,刪除 var 目錄下一些占空間較大的數據文件即可

 

 

繼續定位到占用空間較大的是 /var/log 目錄

 

最後排查到 /var/log/nginx/access_log這個文件占了 66G

 

這個文件是 Nginx 產生的訪問日誌文件,從日誌大小來看,一方面沒有做日誌切割,另一方面很久沒有清理這個文件

 

基本能夠判斷是這個文件造成的告警,執行如下刪除操作

 

 刪除完畢,我們再看下系統磁碟空間

 

 

 

咦?根分區空間怎麼還沒有釋放,不是刪除了文件了嗎?

 

案例現象

一般來講,很少出現刪除了文件但磁碟空間不釋放的現象

 

但是如果出現了,就要考慮到以下兩種情況:

  1. 文件被某一進程鎖定了

  2. 有進程一直在向這個文件寫數據

 

為什麼文件被進程占用之後刪除不會釋放磁碟空間呢?

 

我們來學習一下 Linux 的文件存儲結構

 

在 Linux 中,文件存儲在硬碟上,硬碟的最小存儲單位是扇區(Sector),然而扇區只有 512位元組大小,如果每次都讀寫這麼小的單位效率一定很低

 

 

 

 

所以當操作系統從硬碟讀取數據的時候,不會一個個扇區的地去讀取,而是一次性連續讀取多個扇區,即一次性讀取一個”塊“(block)

 

由多個 sector 組成的 block ,是文件存取的最小單位

 

block 常見大小的是 4KB,即連續 8 個 sector 組成一個 block

 

 

 

既然文件數據都存儲在 block 中,那麼我們指定讀取某個文件數據的時候,操作系統就需要知道這個文件存儲在哪個 block 上

 

而文件的數據存放位置信息被存放到了 inode 上,inode 中文名叫索引節點

 

我要打開 1.txt 這個文件並讀取內容,會經過以下步驟

1、系統根據文件名(1.txt)找到對應的 inode 號

2、通過 inode 號獲取到 inode 信息

3、根據 inode 信息找到文件數據所在的 block ,讀出數據

 

 

除了文件的數據存放信息,文件的創建者、文件的大小、文件的屬性等文件的元信息都被存儲到了 inode 上

 

文件元信息包含以下內容(可以通過 stat 命令查看)

  • 文件的位元組數

  • 文件擁有者的 User ID

  • 文件擁有者的 User ID

  • 文件擁有者的 User ID

  • 文件的時間戳

  • 鏈接數,即有多少文件名指向這個inode

  • 數據block的位置

 

inode 跟數據一樣會消耗硬碟空間,所以硬碟格式化的時候,系統自動將硬碟分成2個區域:

  • 一個是數據區,存放文件數據

  • 另一個是 inode 區,存放 inode 所包含的信息,即文件元信息

 

簡單來說在 Linux 下,文件由指針部分(inode)和數據部分(data)組成

 

在瞭解了文件的存儲結構之後,我們來看下對文件執 rm 行刪除操作之後,這兩個部分會發生什麼

 

文件被刪除的時候,文件對應的 inode 就被刪除掉了,而文件的數據部分在 inode 被清除掉之後,就會被覆蓋並寫入新的內容

 

但是如果文件在刪除的時候是被打開的(有一個進程正在使用該文件,文件被進程鎖定或者有進程一直在向這個文件寫數據等)狀態,那麼進程依舊可以讀取該文件,系統就會認為該文件的磁碟空間一直被占用

 

之所以出現刪除 access_log 文件後空間沒有釋放,是因為 nginx 進程還在一直向這個文件寫入內容

 

雖然刪除了 access_log 文件,但是由於 nginx 進程鎖定,文件的 inode 並沒有清除掉,而由於 inode 沒有清除,系統內核就認為文件並未刪除,這才出現空間不釋放的情況

 

解決問題

既然有了定位的思路,我們就來看看是不是有進程一直在向 access_log 文件寫數據

 

我們使用 lsof 命令

 

 

 

可以看到 /var/log/nginx/access_log被進程 nginx 鎖定,而且 nginx 進程一直在往這個文件寫數據,現在文件大小已經 68G 了

 

由此可見,這個文件就是導致系統根目錄空間耗盡的罪魁禍首,而最後一列的 deleted 狀態表示這個文件已經被刪除

 

但由於進程還在一直往裡面寫數據,導致磁碟空間並未釋放

 

  • 方法一

刪除掉日誌文件之後,重啟 nginx 進程或者重啟系統讓操作系統來回收磁碟空間

 

 

 

但是在生產環境下一般不建議重啟服務或者重啟系統

 

萬一齣問題了,這個鍋可背不起

 

 

  • 方法二(推薦)

像這種進程不停對文件寫數據的操作,如果你想要清空磁碟空間,推薦的辦法是線上清空這個文件

 

 

通過這種方法,磁碟空間不僅可以馬上釋放,也可以保證進程能夠一直往文件里寫數據

 

 


感謝閱讀,喜歡作者就動動小手[一鍵三連],這是我寫作最大的動力


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 1.在自己電腦中找到Viual Studio Installer這樣一個文件,我自己的是在"C:\ProgramData\Microsoft\Windows\Start Menu\Programs"路徑下 若是找不到,也可以下載一個"everything"工具進行搜索,(這個比windows自帶的文 ...
  • #[EF Core] EF Core Code-First 移除外鍵 —— 重寫SQL生成器 使用EF Core時最煩的就是生成的某些 SQL 其實並不是你想要的結果,例如外鍵約束等等。 一個最簡單的例子就是,因為EF Core會根據導航屬性生成外鍵約束等原因,導致很多開發者拋棄了更易維護的Code ...
  • 1、OpenGL有多個標準,如Open ES是為了移動設備,目前通常使用OpenTK.Graphics.OpenGL4對應OpenGL4.x版本,2010年是OpenGL分割領,之前是3版本,之後都是4版本,目前最新4.6,更新頻率不高 2、OpenGL的著色語言GLSL,對應的文件擴展名.vert ...
  • 最近寫了一個demo:demo的github地址 一. 簡單介紹 1. Server端 它是一個WebApi服務,把它當成一個黑盒就行了。 2. MiddleServer端 是重點,它是一個WebApi服務,包含一個GetValues介面和一個Query2介面。 Query2介面是一個簡單的介面。 ...
  • Watchtower 是一個用於自動更新 Docker 容器的工具。它可以監視 Docker Hub 或私有倉庫中的鏡像,併在發現新的鏡像版本時自動更新容器。 ...
  • (文章目錄) 01、首先配置文件地址改了 地址為 ` /etc/NetworkManager/system-connections/網卡名 ` 網卡名可以使用 ip a查看,紅框中就是網卡名 網卡名 ls命令可以看到有以下配置文件 ` es160.nmconnection ` vi編輯 ` [con ...
  • 一、共用記憶體是什麼 在Linux系統中,共用記憶體是一種IPC(進程間通信)方式,它可以讓多個進程在物理記憶體中共用一段記憶體區域。 這種共用記憶體區域被映射到多個進程的虛擬地址空間中,使得多個進程可以直接訪問同一段物理記憶體區域中的數據,從而實現進程間的高速數據交換和通信。 二、共用記憶體的原理 共用記憶體基於 ...
  • 前騰訊工程師,經歷過大廠,也經歷過創業! 我已奔四,但我還在持續學習,持續成長! 我非常樂意把我的經驗和心得分享給你! 我是阿銘,關註我,和我一起成長為技術大牛! ↓↓↓↓↓ 關於DevOps這個概念,可能100個人能給出100個說法,這是因為每個人所接觸到的環境有所差異,不同的公司要解決的問題自然 ...
一周排行
    -Advertisement-
    Play Games
  • Dapr Outbox 是1.12中的功能。 本文只介紹Dapr Outbox 執行流程,Dapr Outbox基本用法請閱讀官方文檔 。本文中appID=order-processor,topic=orders 本文前提知識:熟悉Dapr狀態管理、Dapr發佈訂閱和Outbox 模式。 Outbo ...
  • 引言 在前幾章我們深度講解了單元測試和集成測試的基礎知識,這一章我們來講解一下代碼覆蓋率,代碼覆蓋率是單元測試運行的度量值,覆蓋率通常以百分比表示,用於衡量代碼被測試覆蓋的程度,幫助開發人員評估測試用例的質量和代碼的健壯性。常見的覆蓋率包括語句覆蓋率(Line Coverage)、分支覆蓋率(Bra ...
  • 前言 本文介紹瞭如何使用S7.NET庫實現對西門子PLC DB塊數據的讀寫,記錄了使用電腦模擬,模擬PLC,自至完成測試的詳細流程,並重點介紹了在這個過程中的易錯點,供參考。 用到的軟體: 1.Windows環境下鏈路層網路訪問的行業標準工具(WinPcap_4_1_3.exe)下載鏈接:http ...
  • 從依賴倒置原則(Dependency Inversion Principle, DIP)到控制反轉(Inversion of Control, IoC)再到依賴註入(Dependency Injection, DI)的演進過程,我們可以理解為一種逐步抽象和解耦的設計思想。這種思想在C#等面向對象的編 ...
  • 關於Python中的私有屬性和私有方法 Python對於類的成員沒有嚴格的訪問控制限制,這與其他面相對對象語言有區別。關於私有屬性和私有方法,有如下要點: 1、通常我們約定,兩個下劃線開頭的屬性是私有的(private)。其他為公共的(public); 2、類內部可以訪問私有屬性(方法); 3、類外 ...
  • C++ 訪問說明符 訪問說明符是 C++ 中控制類成員(屬性和方法)可訪問性的關鍵字。它們用於封裝類數據並保護其免受意外修改或濫用。 三種訪問說明符: public:允許從類外部的任何地方訪問成員。 private:僅允許在類內部訪問成員。 protected:允許在類內部及其派生類中訪問成員。 示 ...
  • 寫這個隨筆說一下C++的static_cast和dynamic_cast用在子類與父類的指針轉換時的一些事宜。首先,【static_cast,dynamic_cast】【父類指針,子類指針】,兩兩一組,共有4種組合:用 static_cast 父類轉子類、用 static_cast 子類轉父類、使用 ...
  • /******************************************************************************************************** * * * 設計雙向鏈表的介面 * * * * Copyright (c) 2023-2 ...
  • 相信接觸過spring做開發的小伙伴們一定使用過@ComponentScan註解 @ComponentScan("com.wangm.lifecycle") public class AppConfig { } @ComponentScan指定basePackage,將包下的類按照一定規則註冊成Be ...
  • 操作系統 :CentOS 7.6_x64 opensips版本: 2.4.9 python版本:2.7.5 python作為腳本語言,使用起來很方便,查了下opensips的文檔,支持使用python腳本寫邏輯代碼。今天整理下CentOS7環境下opensips2.4.9的python模塊筆記及使用 ...