近期在超算雲上跑代碼遇到了個烏龍,就是作業一提交到集群上去先是PD狀態,然後馬上就終止調了。後來知道是我用戶目錄下文件數量太多,導致已經超過管理員給我分配的磁碟配額了(眾所周知機器學習相關項目的數據集一般有很多文件)。這邊特此記錄一下如何查看磁碟配額數據。超算用的是Lustre文件系統,該系統是一種... ...
近期在超算雲上跑代碼遇到了個烏龍,就是作業一提交到集群上去先是PD狀態,然後馬上就終止調了。後來知道是我用戶目錄下文件數量太多,導致已經超過管理員給我分配的磁碟配額了(眾所周知機器學習相關項目的數據集一般有很多文件)。這邊特此記錄一下如何查看磁碟配額數據。
1.文件系統的支持與查看
用df命令可查看本系統用的是什麼文件系統。比如我們查看本用戶目錄用的什麼文件系統。
[macong@paratera01 ~]$ df -hT ~
Filesystem Type Size Used Avail Use% Mounted on
12.31.3.27@tcp:/home lustre 2.7T 1.9T 848G 69% /home
可以看到是Lustre文件系統,該系統是一種並行分散式文件系統,通常用於大型電腦集群和超算。Lustre是源自Linux和Cluster的混成詞。
查看該類文件系統磁碟配額的命令為
[macong@paratera01 ~]$ lfs quota
error: missing quota argument(s)
Display disk usage and limits.
usage: quota [-q] [-v] [-h] [-o <obd_uuid>|-i <mdt_idx>|-I <ost_idx>]
[<-u|-g|-p> <uname>|<uid>|<gname>|<gid>|<projid>] <filesystem>
quota [-o <obd_uuid>|-i <mdt_idx>|-I <ost_idx>] -t <-u|-g|-p> <filesystem>
2. 查看此案配額的報告數據
則我們用下列命令參看當前用戶($USER
)在~/project
目錄下的配額,並以人較易閱讀的GBytes、MBytes、KBytes等格式自行顯示:
[macong@paratera01 ~]$ lfs quota -h -u $USER ~/project
Disk quotas for usr macong (uid 53018):
Filesystem used quota limit grace files quota limit grace
/home/macong/project
193.5G 1T 1T - 325835 1000000 1000000 -
可以看到目前我們的磁碟配額中磁碟容量為1T,已用183.5G;文件數量限製為1000000,目前已用325835(當然,文件數量之前是滿了的,這裡我已經清理過了)。
3.討論
我們知道Linux文件系統中的主要規劃為存放屬性的inode與實際文件數據block區塊,磁碟配額既然是管理文件系統,所以當然也可以管理inode與block,這兩個管理的功能為:
- 限制block使用量:管理用戶磁碟容量的限制;
- 限制inode使用量,管理用戶可以建立的文件數量。
參考
- [1] https://zh.wikipedia.org/zh-tw/Lustre
- [2] 鳥哥. 鳥哥的 Linux 私房菜: 基礎學習篇[M]. 人民郵電出版社, 2018.