分析前準備 # 進入工作目錄 cd example_PE250 上一節回顧:我們的OTU獲得了物種註釋,並學習OTU表的各種操作————添加信息,格式轉換,篩選信息。 接下來我們學習對OTU序列的進化分析、同時計算Alpha和Beta多樣性值。 16. 進化樹構建 進化樹是基於多序列比對的結果,可展 ...
分析前準備
# 進入工作目錄 cd example_PE250上一節回顧:我們的OTU獲得了物種註釋,並學習OTU表的各種操作————添加信息,格式轉換,篩選信息。 接下來我們學習對OTU序列的進化分析、同時計算Alpha和Beta多樣性值。 16. 進化樹構建 進化樹是基於多序列比對的結果,可展示豐富的信息,我們將在R繪圖中詳細解讀。此處只是建樹,用於Alpha, Beta多樣性分析的輸入文件。
# clustalo多序列比對,如果沒有請安裝Clustal Omega clustalo -i result/rep_seqs4.fa -o temp/rep_seqs_align.fa --seqtype=DNA --full --force --threads=30 # 篩選結果中保守序列和保守區 filter_alignment.py -i temp/rep_seqs_align.fa -o temp/ # rep_seqs_align_pfiltered.fa, only very short conserved region saved # 基於fasttree建樹 make_phylogeny.py -i temp/rep_seqs_align_pfiltered.fasta -o result/rep_seqs.tree # generate tree by FastTree17. Alpha多樣性 Alpha多樣性是計算樣品內物種組成,包括數量和豐度兩維信息。具體解釋可見:擴增子圖表解讀1箱線圖:Alpha多樣性 Alpha多樣性計算前需要對OTU表進行標準化,因為不同測序深度,檢測到的物種數量會不同。我們將OTU表重抽樣至相同數據量,以公平比較各樣品的物種數量。方法如下:
# 查看樣品的數據量最小值 biom summarize-table -i result/otu_table4.biom # 基於最小值進行重抽樣標準化 single_rarefaction.py -i result/otu_table4.biom -o temp/otu_table_rare.biom -d 2797 # 計算常用的四種Alpha多樣性指數 alpha_diversity.py -i temp/otu_table_rare.biom -o result/alpha.txt -t result/rep_seqs.tree -m shannon,chao1,observed_otus,PD_whole_tree18. Beta多樣性 Beta多樣性是計算各樣品間的相同或不同,OTU表也需要標準化。採用重抽樣方法丟失的信息太多,不利於統計。此步我們選擇CSS標準化方法。
# CSS標準化OTU表 normalize_table.py -i result/otu_table4.biom -o temp/otu_table_css.biom -a CSS # 轉換標準化OTU表為文本,用於後期繪圖 biom convert -i temp/otu_table_css.biom -o result/otu_table_css.txt --table-type="OTU table" --to-tsv # 刪除表格多餘信息,方便R讀取 sed -i '/# Const/d;s/#OTU //g;s/ID.//g' result/otu_table_css.txt # 計算Beta多樣性 beta_diversity.py -i temp/otu_table_css.biom -o result/beta/ -t result/rep_seqs.tree -m bray_curtis,weighted_unifrac,unweighted_unifrac # Beta多樣性距離文件整理,方便R讀取 sed -i 's/^\t//g' result/beta/*