第一次寫博客,分享一個做的提取基因序列的程式,根據bed文件里的位置信息從基因組裡提取序列 源碼地址:https://github.com/Liuyuan2018/fastaTools/blob/master/pyGetFasta.py bed文件通常用來保存註釋基因信息,BED文件必須的3列: c ...
第一次寫博客,分享一個做的提取基因序列的程式,根據bed文件里的位置信息從基因組裡提取序列
源碼地址:https://github.com/Liuyuan2018/fastaTools/blob/master/pyGetFasta.py
bed文件通常用來保存註釋基因信息,BED文件必須的3列:
- chrom - 染色體號
- chromStart - feature在染色體上起始位置(其實編號為0)
- chromEnd - feature在染色體上末尾位置(不包括此編號)
第四列是基因的名稱
還有些列想瞭解參考:http://genome.ucsc.edu/FAQ/FAQformat.html#format1
程式依賴 pyfasta模塊(https://pypi.org/project/pyfasta/)
安裝pyfasta的命令:pip install pyfasta