一、查看日誌 線上出現了問題,登上線上的機器查日誌是非常常見的操作了。我第一次登上線上機器查日誌的時候,我還只記得以下的幾個命令(假設現在我們的日誌文件叫做service.log): cat service.log tail f service.log vim serivice.log (明顯是不夠 ...
一、查看日誌
線上出現了問題,登上線上的機器查日誌是非常常見的操作了。我第一次登上線上機器查日誌的時候,我還只記得以下的幾個命令(假設現在我們的日誌文件叫做service.log):
cat service.log
tail -f service.log
vim serivice.log
(明顯是不夠用的)
現在日誌每天產出的大小大概1GB:
每天產出1GB大小的日誌
每天產出1GB大小的日誌
如果是小文件的話,單純的cat命令還是可以應付的,但如果你直接用cat命令打開一個1GB的日誌文件,保證卡死你(ctrl + c退出cat命令需要很久才能將cat命令停下來)。
一般我只用cat來查看這個小文件的文本內容是什麼
同樣地,如果是小文件,單純的vim命令去打開文件也是可以應付的,但如果你用vim命令去打開一個1GB甚至更大的文件,也能明顯感受到緩慢和卡頓。
平時我還是很喜歡用vim去查找對應的記錄的,我一般的操作:
vim service
按G跳轉到文件的末尾
按? +關鍵字搜索對應的記錄
按n往上查詢,按N往下查詢
tail -f service.log 這個命令我一般用於查看流量是否進來了(或者調試的時候可以直接看到日誌,再迅速ctrl +c關掉)
面對比較大的日誌文件,這我們就得配合grep來玩了,比如我們現在得知某個手機號收不到簡訊驗證碼,想要看一下這個手機號的日誌是怎麼樣的。於是我們就可以這樣搞:
cat service.log | grep 13888888888
這麼一搞,就能將service.log中所有含有13888888888的記錄給搜出來,搜索的速度還是賊快的。
檢索日誌
檢索日誌
現在我們已經能根據關鍵字搜到對應的記錄了,接著我想看一下那條記錄的日誌上下文【這樣就能知道這條數據大概的執行狀態了】
首先,我們先要查出對應記錄的行號,在cat 命令後面加上一個 -n 參數就好了。所以命令是:cat -n service.log | grep 13888888888 ,如下圖我們就可以查到對應的行號了
查看行數
查看行數
現在行數是29506,我們一般只要看一下29506的前10行和後10行就差不多知道問題出現在哪了,於是我們可以這樣做:
sed -n "29496,29516p" service.log:從29496行開始檢索,到29516行結束
cat -n service.log | tail -n +29496 | head -n 20:從29496行開始檢索,往前推20條
如果關鍵字不太準確(日誌輸出的記錄太多了),我們可以使用more命令來瀏覽或者輸出到文件上再分析:
cat service.log | grep 13 |more :將查詢後的結果交由more輸出
cat service.log | grep 13 > /home/sanwai/aa.txt 將查詢後的結果寫到/home/sanwai/aa.txt文件上
有的時候,我們想統計這個日誌輸出了多少行,我們可以使用這條命令:
cat service.log | wc -l
查看行數
查看行數
參考資料:
https://www.cnblogs.com/xiashan17/p/7059978.html
二、查進程和埠
查進程有兩個命令:
ps -ef
ps aux
上面兩個命令都是列出所有的進程,我們還是通過 |管道和grep 來過濾掉想要查的進程,比如說:ps -ef |grep java
把進程查出來幹嘛?知道它的進程ID了,我們可以把他給殺掉。
kill -9 processId:殺掉某個進程
查埠也是一個很常見的操作,常見命令:netstat -lntup:
l:listening n:num t:tcp u:udp p:display PID/Program name for sockets
查看當前所有tcp/udp埠的信息
查看某個埠詳細的信息:lsof -i:4000
查看某個埠的詳細信息
查看某個埠的詳細信息
三、查看系統的狀態
3.1 TOP實時查看進程的狀態
TOP命令查看進程的狀態,其中有個load average可能不是那麼好理解,下麵來解釋一下:
load average:在特定時間間隔內運行隊列中(在CPU上運行或者等待運行多少進程)的平均進程數。
load average 有三個值,分別代表:1分鐘、5分鐘、15分鐘內運行進程隊列中的平均進程數量。
正在運行的進程 + 準備好等待運行的進程 在特定時間內(1分鐘,5分鐘,10分鐘)的平均進程數
Linux進程可以分為三個狀態:
阻塞進程
可運行的進程
正在運行的進程
比如現在系統有2個正在運行的進程,3個可運行進程,那麼系統的load就是5,load average就是一定時間內的load數量均值。
3.2free查看記憶體使用狀況
linux的記憶體管理機制的思想包括(不敢說就是)記憶體利用率最大化,內核會把剩餘的記憶體申請為cached,而cached不屬於free範疇。
如果free的記憶體不夠,內核會把部分cached的記憶體回收,回收的記憶體再分配給應用程式。所以對於linux系統,可用於分配的記憶體不只是free的記憶體,還包括cached的記憶體(其實還包括buffers)。
可用記憶體=free的記憶體+cached的記憶體+buffers
Buffer Cache和Page Cache。前者針對磁碟塊的讀寫,後者針對文件inode的讀寫。這些Cache有效縮短了 I/O系統調用(比如read,write,getdents)的時間。磁碟的操作有邏輯級(文件系統)和物理級(磁碟塊)
參考資料:
https://blog.csdn.net/zhangchenglikecc/article/details/52103737
https://www.cnblogs.com/peida/archive/2012/12/24/2831353.html
最後
我工作時長比較短,所以可能會有很多命令會忽略掉了,歡迎在評論區補充比較常用的命令。後續如果某些命令比較常見的,我再分享哈~