首先把測試數據存儲到文件中方便調用。數據矩陣存儲在line_data.xls和line_data_melt.xls文件中 (直接拷貝到文件中也可以,這裡這麼操作只是為了隨文章提供個測試文件,方便使用。如果你手上有自己的數據,也可以拿來用)。 profile = "Pos;H3K27ac;CTCF;E ...
首先把測試數據存儲到文件中方便調用。數據矩陣存儲在line_data.xls和line_data_melt.xls文件中 (直接拷貝到文件中也可以,這裡這麼操作只是為了隨文章提供個測試文件,方便使用。如果你手上有自己的數據,也可以拿來用)。
profile = "Pos;H3K27ac;CTCF;Enhancer;H3K4me3;polII -5000;8.7;10.7;11.7;10;8.3 -4000;8.4;10.8;11.8;9.8;7.8 -3000;8.3;10.5;12.2;9.4;7 -2000;7.2;10.9;12.7;8.4;4.8 -1000;3.6;8.5;12.8;4.8;1.3 0;3.6;8.5;13.4;5.2;1.5 1000;7.1;10.9;12.4;8.1;4.9 2000;8.2;10.7;12.4;9.5;7.7 3000;8.4;10.4;12;9.8;7.9 4000;8.5;10.6;11.7;9.7;8.2 5000;8.5;10.6;11.7;10;8.2" profile_text <- read.table(text=profile, header=T, row.names=1, quote="",sep=";") # tab鍵分割,每列不加引號 write.table(profile_text, file="line_data.xls", sep="\t", row.names=T, col.names=T,quote=F) # 如果看著第一行少了ID列不爽,可以填補下 system("sed -i '1 s/^/ID\t/' line_data.xls") profile = "Pos;variable;value;set -5000;H3K27ac;8.71298;A -4000;H3K27ac;8.43246;A -3000;H3K27ac;8.25497;A -2000;H3K27ac;7.16265;A -1000;H3K27ac;3.55341;A 0;H3K27ac;3.5503;A 1000;H3K27ac;7.07502;A 2000;H3K27ac;8.24328;A 3000;H3K27ac;8.43869;A 4000;H3K27ac;8.48877;A -5000;CTCF;10.6913;A -4000;CTCF;10.7668;A -3000;CTCF;10.5441;A -2000;CTCF;10.8635;A -1000;CTCF;8.45751;A 0;CTCF;8.50316;A 1000;CTCF;10.9143;A 2000;CTCF;10.7022;A 3000;CTCF;10.4101;A 4000;CTCF;10.5757;A -5000;H3K27ac;8.71298;B -4000;H3K27ac;8.43246;B -3000;H3K27ac;8.25497;B -2000;H3K27ac;7.16265;B -1000;H3K27ac;3.55341;B 0;H3K27ac;3.5503;B 1000;H3K27ac;7.07502;B 2000;H3K27ac;8.24328;B 3000;H3K27ac;8.43869;B 4000;H3K27ac;8.48877;B -5000;CTCF;10.6913;B -4000;CTCF;10.7668;B -3000;CTCF;10.5441;B -2000;CTCF;10.8635;B -1000;CTCF;8.45751;B 0;CTCF;8.50316;B 1000;CTCF;10.9143;B 2000;CTCF;10.7022;B 3000;CTCF;10.4101;B 4000;CTCF;10.5757;B" profile_text <- read.table(text=profile, header=T, quote="",sep=";") # tab鍵分割,每列不加引號 write.table(profile_text, file="line_data_melt.xls", sep="\t", row.names=T, col.names=T,quote=F) # 如果看著第一行少了ID列不爽,可以填補下 system("sed -i '1 s/^/ID\t/' line_data_melt.xls")
使用正常矩陣預設參數繪製個線圖
# -f: 指定輸入的矩陣文件,第一列為行名字,第一行為header。列數不限,列名字不限;行數不限,行名字預設為文本 # -A FALSE: 指定行名為數字 sp_lines.sh -f line_data.xls -A FALSE
# -l: 設定圖例的順序 # -o TRUE: 局部擬合獲得平滑曲線 # -A FALSE: 指定行名為數字 # -P: 設置legend位置,相對於原點的坐標 # -x, -y指定橫縱軸標記 sp_lines.sh -f line_data.xls -l "'CTCF','Enhancer','polII','H3K4me3','H3K27ac'" -P 'c(0.8,0.3)' -o TRUE -A FALSE -x 'Up and down 5 kb of TSS' -y 'Relative density'
# -A FALSE: 指定行名為數字 # -V 'c(-1000, 500)': 設置垂線的位置 # -D: 設置垂線的文本標記,參數為引號引起來的vector,註意引號的嵌套 # -I: 設置橫軸的標記的位置 # -b: 設置橫軸標記的文字 sp_lines.sh -f line_data.xls -A FALSE -V 'c(-1000,500)' -D "c('+1 kb','-0.5 kb')" -I "c(-5000,0,5000)" -b "c('-5 kb', 'TSS', '+5 kb')"使用melted矩陣預設參數繪製個線圖 (除需要改變文件格式,指定-m TRUE -a xvariable外其它與正常矩陣一樣)
# -f: 指定輸入文件 # -m TRUE: 指定輸入的矩陣為melted format, 三列,第一列為Pos (給-a) # 第二列為variable (給-H,-H預設即為variable) # 第三列為value,名字不可修改 # -A FALSE: 指定行名為數字 # -P 'c(0.8,0.2)': 設置legend位置,相對於原點的坐標 sp_lines.sh -f line_data_melt.xls -a Pos -m TRUE -A FALSE -P 'c(0.8,0.2)'完整的圖
# -C: 自定義線的顏色 sp_lines.sh -f line_data_melt.xls -a Pos -m TRUE -A FALSE -P 'c(0.8,0.2)' -o TRUE -V 'c(-1000,500)' -D "c('+1 kb','-0.5 kb')" -I "c(-5000,0,4000)" -b "c('-5 kb', 'TSS', '+4 kb')" -x 'Up 5 kb and down 4 kb of TSS' -y 'Relative density' -C "'pink', 'blue'"數中最需要註意的是引號的使用:
- 外層引號與內層引號不能相同
- 凡參數值中包括了空格,括弧,逗號等都用引號括起來作為一個整體