宋寶華:關於Ftrace的一個完整案例

来源:https://www.cnblogs.com/linuxdev/archive/2019/11/07/11815965.html
-Advertisement-
Play Games

本文系轉載,著作權歸作者所有。商業轉載請聯繫作者獲得授權,非商業轉載請註明出處。 作者: 宋寶華 來源: 微信公眾號linux閱碼場(id: linuxdev) Ftrace簡介 Ftrace是Linux進行代碼級實踐分析最有效的工具之一,比如我們進行一個系統調用,出來的時間過長,我們想知道時間花哪 ...


本文系轉載,著作權歸作者所有。商業轉載請聯繫作者獲得授權,非商業轉載請註明出處。

作者: 宋寶華

來源: 微信公眾號linux閱碼場(id: linuxdev)

file


Ftrace簡介

Ftrace是Linux進行代碼級實踐分析最有效的工具之一,比如我們進行一個系統調用,出來的時間過長,我們想知道時間花哪裡去了,利用Ftrace就可以追蹤到一級級的時間分佈。

Ftrace案例

寫一個proc模塊,包含一個proc的讀和寫的入口。test_proc_show()故意調用了一個kill_time()的函數,而kill_time()的函數,又調用了mdelay(2)和kill_moretime()的函數,該函數體內調用mdelay(2)。

kill_time()的函數和kill_moretime()函數前面都加了noinline以避免被編譯器inline優化掉。

#include <linux/module.h>
#include <linux/kernel.h>
#include <linux/init.h>
#include <linux/version.h>
#include <linux/proc_fs.h>
#include <linux/seq_file.h>
#include <linux/delay.h>
#include <linux/uaccess.h>


static unsigned int variable;
static struct proc_dir_entry *test_dir, *test_entry;


static noinline void kill_moretime(void)
{
mdelay(2);
}


static noinline void kill_time(void)
{
mdelay(2);
kill_moretime();
}


static int test_proc_show(struct seq_file *seq, void *v)
{
unsigned int *ptr_var = seq->private;
kill_time();
seq_printf(seq, "%u\n", *ptr_var);
return 0;
}


static ssize_t test_proc_write(struct file *file, const char __user *buffer,
size_t count, loff_t *ppos)
{
struct seq_file *seq = file->private_data;
unsigned int *ptr_var = seq->private;
int err;
char *kbuffer;


        if (!buffer || count > PAGE_SIZE - 1)
                return -EINVAL;


kbuffer = (char *)__get_free_page(GFP_KERNEL);
if (!kbuffer)
return -ENOMEM;


err = -EFAULT;
if (copy_from_user(kbuffer, buffer, count))
goto out;
kbuffer[count] = '\0';


*ptr_var = simple_strtoul(kbuffer, NULL, 10);
return count;


out:
free_page((unsigned long)buffer);
return err;
}


static int test_proc_open(struct inode *inode, struct file *file)
{
return single_open(file, test_proc_show, PDE_DATA(inode));
}


static const struct file_operations test_proc_fops =
{
.owner = THIS_MODULE,
.open = test_proc_open,
.read = seq_read,
.write = test_proc_write,
.llseek = seq_lseek,
.release = single_release,
};


static __init int test_proc_init(void)
{
test_dir = proc_mkdir("test_dir", NULL);
if (test_dir) {
test_entry = proc_create_data("test_rw",0666, test_dir, &test_proc_fops, &variable);
if (test_entry)
return 0;
}


return -ENOMEM;
}
module_init(test_proc_init);


static __exit void test_proc_cleanup(void)
{
remove_proc_entry("test_rw", test_dir);
remove_proc_entry("test_dir", NULL);
}
module_exit(test_proc_cleanup);


MODULE_AUTHOR("Barry Song <[email protected]>");
MODULE_DESCRIPTION("proc exmaple");
MODULE_LICENSE("GPL v2");

模塊對應的Makefile如下:

KVERS = $(shell uname -r)


# Kernel modules
obj-m += proc.o


# Specify flags for the module compilation.
#EXTRA_CFLAGS=-g -O0


build: kernel_modules


kernel_modules:
make -C /lib/modules/$(KVERS)/build M=$(CURDIR) modules


clean:
make -C /lib/modules/$(KVERS)/build M=$(CURDIR) clean

編譯並且載入:

$ make
baohua@baohua-perf:~/develop/training/debug/ftrace/proc$ 
$ sudo insmod proc.ko
[sudo] password for baohua: 

之後/proc目錄下/proc/test_dir/test_rw文件可被讀寫。

下麵我們用Ftrace來跟蹤test_proc_show()這個函數。

我們把啟動ftrace的所有命令寫到一個腳本function.sh裡面:

#!/bin/bash


debugfs=/sys/kernel/debug
echo nop > $debugfs/tracing/current_tracer
echo 0 > $debugfs/tracing/tracing_on
echo $$ > $debugfs/tracing/set_ftrace_pid
echo function_graph > $debugfs/tracing/current_tracer
#replace test_proc_show by your function name
echo test_proc_show > $debugfs/tracing/set_graph_function
echo 1 > $debugfs/tracing/tracing_on
exec "$@"

然後用這個腳本去啟動cat /proc/test_dir/test_rw,這樣ftrace下麵test_proc_show()函數就被trace了。

# ./function.sh cat /proc/test_dir/test_rw
0

讀取trace的結果:

# cat /sys/kernel/debug/tracing/trace > 1

接著用vim打開這個文件1,發現這個文件有600多行:

file

file

長到看不清!!

Ftrace結果怎麼讀?

Ftrace結果怎麼讀?答案非常簡單:如果是葉子函數,就直接在這個函數的前面顯示它占用的時間,如果是非葉子,要等到 }的時候,再顯示時間,如下圖:

file

延遲比較大的部分,會有+、#等特殊標號:

 '$' - greater than 1 second
 '@' - greater than 100 milisecond
 '*' - greater than 10 milisecond
 '#' - greater than 1000 microsecond
 '!' - greater than 100 microsecond
 '+' - greater than 10 microsecond
 ' ' - less than or equal to 10 microsecond.

## vim對Ftrace進行摺疊
上面那個Ftrace文件太大了,大到看不清。我們可以用vim來摺疊之,不過需要一個vim的特別配置,我把它存放在了我的~目錄,名字叫.fungraph-vim:

" Enable folding for ftrace function_graph traces.
"
" To use, :source this file while viewing a function_graph trace, or use vim's
" -S option to load from the command-line together with a trace.  You can then
" use the usual vim fold commands, such as "za", to open and close nested
" functions.  While closed, a fold will show the total time taken for a call,
" as would normally appear on the line with the closing brace.  Folded
" functions will not include finish_task_switch(), so folding should remain
" relatively sane even through a context switch.
"
" Note that this will almost certainly only work well with a
" single-CPU trace (e.g. trace-cmd report --cpu 1).


function! FunctionGraphFoldExpr(lnum)
  let line = getline(a:lnum)
  if line[-1:] == '{'
    if line =~ 'finish_task_switch() {$'
      return '>1'
    endif
    return 'a1'
  elseif line[-1:] == '}'
    return 's1'
  else
    return '='
  endif
endfunction


function! FunctionGraphFoldText()
  let s = split(getline(v:foldstart), '|', 1)
  if getline(v:foldend+1) =~ 'finish_task_switch() {$'
    let s[2] = ' task switch  '
  else
    let e = split(getline(v:foldend), '|', 1)
    let s[2] = e[2]
  endif
  return join(s, '|')
endfunction


setlocal foldexpr=FunctionGraphFoldExpr(v:lnum)
setlocal foldtext=FunctionGraphFoldText()
setlocal foldcolumn=12
setlocal foldmethod=expr

之後我們配置vim為這個模板來打開前面那個600多行的文件1:

vim -S ~/.fungraph-vim 1

這樣我們看到的樣子是:

file

我們可以把游標移動到第5行,鍵盤敲打za,則展開為:

file

繼續展開第6行的kill_time(),按za:

file

我們可以用z、a兩個按鍵,搜索或者展開Ftrace的結果。

最後,https://github.com/brendangregg/perf-tools 對Ftrace的功能進行了很好的封裝和集成,建議大家用perf-tools來使用Ftrace,則效果更佳更簡單。

有空再聊perf-tools。

更多精彩更新中……歡迎關註微信公眾號:linux閱碼場(id: linuxdev)


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 在上一篇( abp(net core)+easyui+efcore實現倉儲管理系統——EasyUI之貨物管理六(二十四)) 實測文章中,我們修正了一些BUG,讓貨物信息管理的前端與後臺功能基本實現了我們所要。現在我們運行起應用程式進行修改與刪除功能的測試。 ...
  • 今天在winform中設置了combox的模糊查詢功能的相關屬性之後, this.comboBoxPM.AutoCompleteSource = System.Windows.Forms.AutoCompleteSource.ListItems; this.comboBoxPM.AutoComple ...
  • 搭建環境:Windows 10 參與文檔:https://github.com/exceptionless/Exceptionless/wiki/Self-Hosting 運行環境: .NET 4.6.1 Java JDK 1.8(如果用此文章中的exceptionless,JDK版本必須為1.8) ...
  • 很多人寫的博客大家看了會一知半解,不知道怎麼用,應該引用什麼類庫或者代碼不全,這樣很多小白很是頭疼,尤其是嘗新技術更是如此。我們這邊不止告訴你步驟,而且還提供開源demo。隨著時間的推移,我們的demo庫會日益強大請及時收藏GitHub。 1.首先你需要Nuget引用類庫 Install-Packa ...
  • [toc] 前言 從開始敲代碼到現在,不停地都是在喊著記得做測試,記得自測,測試人員打回來扣你money之類的,剛開始因為心疼錢(當然還是為了代碼質量),就老老實實自己寫完自己跑一遍,沒有流程沒有規劃沒有測試文檔,就是自己整理一組數據跑一遍,最後依然還是讓測試人員老老實實把一大堆測試問題扔給你。 單 ...
  • 1. Composition Lighting UWP中的Composition Light是一組可以創建3D光照的API,它明明十分好玩而且強大, 但博客園幾乎沒有相關文章(用 或`pointlight`做關鍵字只能找到我自己的文章),這篇文章就 來介紹Composition Lighting的入 ...
  • 在一個二維數組中(每個一維數組的長度相同),每一行都按照從左到右遞增的順序排序,每一列都按照從上到下遞增的順序排序。請完成一個函數,輸入這樣的一個二維數組和一個整數,判斷數組中是否含有該整數。 ...
  • 轉自:http://www.maomao365.com/?p=2037 一、touch命令簡介touch的命令功能說明: 1 可以通過touch新建一個文件; 2 可以修改文件的時間戳; 3 可以批量修改文件或目錄下所有文件的時間戳;二、命令參數說明 -a 修改access 和 change時間 { ...
一周排行
    -Advertisement-
    Play Games
  • 基於.NET Framework 4.8 開發的深度學習模型部署測試平臺,提供了YOLO框架的主流系列模型,包括YOLOv8~v9,以及其系列下的Det、Seg、Pose、Obb、Cls等應用場景,同時支持圖像與視頻檢測。模型部署引擎使用的是OpenVINO™、TensorRT、ONNX runti... ...
  • 十年沉澱,重啟開發之路 十年前,我沉浸在開發的海洋中,每日與代碼為伍,與演算法共舞。那時的我,滿懷激情,對技術的追求近乎狂熱。然而,隨著歲月的流逝,生活的忙碌逐漸占據了我的大部分時間,讓我無暇顧及技術的沉澱與積累。 十年間,我經歷了職業生涯的起伏和變遷。從初出茅廬的菜鳥到逐漸嶄露頭角的開發者,我見證了 ...
  • C# 是一種簡單、現代、面向對象和類型安全的編程語言。.NET 是由 Microsoft 創建的開發平臺,平臺包含了語言規範、工具、運行,支持開發各種應用,如Web、移動、桌面等。.NET框架有多個實現,如.NET Framework、.NET Core(及後續的.NET 5+版本),以及社區版本M... ...
  • 前言 本文介紹瞭如何使用三菱提供的MX Component插件實現對三菱PLC軟元件數據的讀寫,記錄了使用電腦模擬,模擬PLC,直至完成測試的詳細流程,並重點介紹了在這個過程中的易錯點,供參考。 用到的軟體: 1. PLC開發編程環境GX Works2,GX Works2下載鏈接 https:// ...
  • 前言 整理這個官方翻譯的系列,原因是網上大部分的 tomcat 版本比較舊,此版本為 v11 最新的版本。 開源項目 從零手寫實現 tomcat minicat 別稱【嗅虎】心有猛虎,輕嗅薔薇。 系列文章 web server apache tomcat11-01-官方文檔入門介紹 web serv ...
  • 1、jQuery介紹 jQuery是什麼 jQuery是一個快速、簡潔的JavaScript框架,是繼Prototype之後又一個優秀的JavaScript代碼庫(或JavaScript框架)。jQuery設計的宗旨是“write Less,Do More”,即倡導寫更少的代碼,做更多的事情。它封裝 ...
  • 前言 之前的文章把js引擎(aardio封裝庫) 微軟開源的js引擎(ChakraCore))寫好了,這篇文章整點js代碼來測一下bug。測試網站:https://fanyi.youdao.com/index.html#/ 逆向思路 逆向思路可以看有道翻譯js逆向(MD5加密,AES加密)附完整源碼 ...
  • 引言 現代的操作系統(Windows,Linux,Mac OS)等都可以同時打開多個軟體(任務),這些軟體在我們的感知上是同時運行的,例如我們可以一邊瀏覽網頁,一邊聽音樂。而CPU執行代碼同一時間只能執行一條,但即使我們的電腦是單核CPU也可以同時運行多個任務,如下圖所示,這是因為我們的 CPU 的 ...
  • 掌握使用Python進行文本英文統計的基本方法,並瞭解如何進一步優化和擴展這些方法,以應對更複雜的文本分析任務。 ...
  • 背景 Redis多數據源常見的場景: 分區數據處理:當數據量增長時,單個Redis實例可能無法處理所有的數據。通過使用多個Redis數據源,可以將數據分區存儲在不同的實例中,使得數據處理更加高效。 多租戶應用程式:對於多租戶應用程式,每個租戶可以擁有自己的Redis數據源,以確保數據隔離和安全性。 ...