轉錄組入門(5):序列比對

来源:http://www.cnblogs.com/freescience/archive/2017/08/16/7342895.html
-Advertisement-
Play Games

任務列表 比對軟體 hisat2的用法 下載index文件 比對、排序、索引 質量控制 載入IGV,截圖幾個基因 hisat2的用法 本作業是比對到基因組,所以使用gapped or splices mapper,此流程已經更新。TopHat首次被髮表已經是7年前,STAR的比對速度是TopHat的 ...


任務列表
  • 比對軟體
  • hisat2的用法
  • 下載index文件
  • 比對、排序、索引
  • 質量控制
  • 載入IGV,截圖幾個基因
hisat2的用法 本作業是比對到基因組,所以使用gapped or splices mapper,此流程已經更新。TopHat首次被髮表已經是7年前,STAR的比對速度是TopHat的50倍,HISAT更是STAR的1.2倍。HISAT2是TopHat2/Bowti2的繼任者,使用改進的BWT演算法,實現了更快的速度和更少的資源占用,作者推薦TopHat2/Bowti2和HISAT的用戶轉換到HISAT2。 官網:https://ccb.jhu.edu/software/hisat2/index.shtml(學習一個軟體最好的方法就是結合現有中文資料,加上閱讀官方說明書和HELP文檔,一般剛開始學習的時候先使用預設參數,不要亂調參數) 下載index文件
cd ~/reference
mkdir -p index/hisat && cd index/hisat
wget -c ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/data/hg19.tar.gz
wget -c ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/data/mm10.tar.gz
tar zxvf hg19.tar.gz
tar xvzf mm10.tar.gz
-c:斷點續傳 比對、排序、索引 把fastq格式的reads比對上去得到sam文件,接著用samtools把它轉為bam文件,並且排序(註意N和P兩種排序區別)索引好(可以使用管道實現,省去中間SAM保存的過程,直接輸出BAM文件) 編寫bash腳本:map.sh
#! usr/bin/bash
set -u
set -e
set -o pipefail
hg19_ref=/mnt/hgfs/2017/reference/index/hisat/hg19/genome
mm10_ref=/mnt/hgfs/2017/reference/index/hisat/mm10/genome
data_path=/mnt/hgfs/2017/rna_seq/data
NUM_THREADS=25
ls --color=never Homo*1.fastq.gz | while read id;do(~/biosoft/hisat2-2.1.0/hisat2 -t -p $NUM_THREADS -x $hg19_ref -1 $data_path/${id%_*}_1.fastq.gz -2 $data_path/${id%_*}_2.fastq.gz 2 > ${id%_*}_map.log | samtools view -Sb  - > ${id%_*}.bam);done
ls --color=never Mus*1.fastq.gz | while read id;do(~/biosoft/hisat2-2.1.0/hisat2 -t -p $NUM_THREADS -x $mm10_ref -1 $data_path/${id%_*}_1.fastq.gz -2 $data_path/${id%_*}_2.fastq.gz 2 > ${id%_*}_map.log | samtools view -Sb  - > ${id%_*}.bam);done
ls --color=never *.bam | while read id;do(samtools sort --threads $NUM_THREADS $id -o ${id%.*}_sorted.bam);done
ls --color=never *_sorted.bam | while read id;do(samtools index $id);done
運行腳本: 
bash map.sh
質量控制 對bam文件進行簡單QC Reads比對後的質量控制(評估比對質量的指標) 比對上的reads占總reads的百分比; Reads比對到外顯子和參考鏈上的覆蓋度是否一致; 比對到基因組序列,多重比對reads; 相關質控軟體除了Picard,RSeQC,Qualimap還有一大堆
您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 如果轉載,請註明博文來源: www.cnblogs.com/xinysu/ ,版權歸 博客園 蘇家小蘿蔔 所有。望各位支持! 少年入門筆記,整理出來一起入坑!入門的視屏來自imooc的:http://www.imooc.com/learn/839 如果轉載,請註明博文來源: www.cnblogs. ...
  • 打開網址可以看到這是一個類似chm格式但可以線上瀏覽的參考手冊,非常的完美,該手冊詳細講解了:如何安裝mysql,MySQL管理器,查詢瀏覽器,移植工具包,以及sql語句語法,優化,函數和操作符,存儲引擎和表類型等等內容,是學習mysq必備的參考手冊,能夠讓廣大網友們更好更輕鬆的掌握mysql資料庫... ...
  • EF對於已有資料庫的Code First支持 原文鏈接 本文將逐步介紹怎樣用Code First的方式基於已有資料庫進行開發。Code First支持你使用C#或者VB.Net定義類.並使用數據模型標識和Fluent API定義與配置模型。 前提 已經安裝 Visual Studio 2012 或者 ...
  • 嵌套查詢 一個SELECT FROM WHERE語句稱為一個查詢塊。 嵌套查詢:將一個查詢塊嵌套在另一個查詢塊的WHERE子句或者HAVING短語的條件中的查詢。 註:子查詢的SELECT語句中不能使用ORDER BY子句,ORDER BY子句只能對最終查詢結果排序。 1.帶有IN謂詞的子查詢: 子 ...
  • 本文出處:http://www.cnblogs.com/wy123/p/7366486.html (保留出處並非什麼原創作品權利,本人拙作還遠遠達不到,僅僅是為了鏈接到原文,因為後續對可能存在的一些錯誤進行修正或補充,無他) mysql執行計劃中的extra列中表明瞭執行計劃的每一步中的實現細節,其 ...
  • 問題: 因為SQL資料庫備份的時候沒註意,把一個表的數據導出成了腳本,結果文件大小居然有200多兆,執行直接sql報錯 方法: 1、新建一個文本,添加如下內容,保存,修改尾碼為.bat批處理文件。 解釋: -U 用戶名 -P 密碼 -S IP+埠 -d 庫名稱 -i cmd.sql (待執行的sq ...
  • 出處:http://blog.csdn.net/jsship/article/details/42914217 運行mysql命令時,出現的錯誤提示是亂碼 : [Err] 1064 - Erreur de syntaxe près de '2' à la ligne 1 ...
  • 在伺服器上訓練並保存模型,複製到本地之後load_model()報錯: ValueError: Tensor conversion requested dtype int32 for Tensor with dtype float32: 'Tensor("embedding_1/random_uni ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...