轉錄組入門(3):瞭解fastq測序數據

来源:http://www.cnblogs.com/freescience/archive/2017/08/08/7277620.html
-Advertisement-
Play Games

sra文件轉換為fastq格式 fastq-dump -h --split-3 也就是說如果SRA文件中只有一個文件,那麼這個參數就會被忽略。如果原文件中有兩個文件,那麼它就會把成對的文件按*_1.fastq,*_2.fastq這樣分開。如果還出現了第三個文件,就意味著這個文件本身是未成配對的部分。 ...


sra文件轉換為fastq格式  
fastq-dump -h
--split-3 也就是說如果SRA文件中只有一個文件,那麼這個參數就會被忽略。如果原文件中有兩個文件,那麼它就會把成對的文件按*_1.fastq,*_2.fastq這樣分開。如果還出現了第三個文件,就意味著這個文件本身是未成配對的部分。可能是當初提交的時候因為事先過濾過了一下,所以有一部分數據被刪除了。   --gzip 輸出文件壓縮成gzip格式(通常gzip僅用來壓縮單個文件。多個文件的壓縮歸檔通常是首先將這些文件合併成一個tar文件,然後再使用gzip進行壓縮,最後生成的.tar.gz或者.tgz文件就是所謂的“tar壓縮包”或者“tarball”)   --bzip2 輸出文件壓縮成bzip2格式(bzip2比傳統的gzip或者ZIP的壓縮效率更高,但是它的壓縮速度較慢)  
ls *.sra|while read id;do(fastq-dump --split-3 $id);done
我們的數據是Illumina的雙端測序,所以用fastq-dump --split-3命令來把sra格式數據轉換為fastq。   總共有7個測序數據,所以最好是同步改名,用-A參數,為了節省空間,用--gzip壓縮。
perl -F'\t' -alne 'if($F[7]=~/SRR/){$F[6]=~s/\s/_/g;$F[13]=~s/\s|#/_/g;$F[13]=~s/\(|\)//g;print "$F[7]\t$F[6]_$F[13]"}' SraRunTable.txt > Rename.txt
perl -F'\t' -alne 'print "fastq-dump --split-3 --gzip -A $F[1] $F[0].sra"' Rename.txt > sratofq.sh
bash sratofq.sh
  數據校驗及備份存放   在此最開始之前應該做個md5sum數據傳輸完整性驗證;或者拿到自己的數據後,壓縮後生產MD5文件,然後備份保存
md5sum *.fastq.gz > md5sum.txt
  質控FastQC  
mkdir rna_seq/work && cd rna_seq/work
ln ../data/* .  # 建立軟連接
mkdir 1_FastQC_Raw_Data
ls *.gz|while read id;do(fastqc $id -o 1_FastQC_Raw_Data -t 3);done
問題: FastQC報告中哪些是值得關註的? 註意事項: 1、數據質控是一個綜合的評價標準,其中主要指標為鹼基質量與含量分佈,如果這兩個指標合格了,後面大部分指標都可以通過。如果這兩項不合格,其餘都會受到影響。 2、其中一些指標並不適合所有數據。要根據具體數據類型,具體分析。
您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 沒必要記住所有東西 如下圖。 可以看出,我們沒必要記住所有東西,只需要記住常用命令甚至是命令開頭就可以,然後利用幫助命令。 HELP 實踐:看ls命令的HELP MAN 如果--help不夠詳細的話,可以使用MAN命令。 實踐:還是使用MAN命令查看ls命令的幫助文檔 這個文檔更像一個CHM之類的幫 ...
  • 1.查看防火牆狀態 命令:firewall-cmd --state 結果: 2.防火牆是運行狀態,先關閉防火牆服務 命令:systemctl mask firewalld 3.關閉防火牆 命令:systemctl stop firewalld 4.檢查防火牆狀態 命令:firewall-cmd -- ...
  • 認識掛載 如下圖。 掛載 實踐:將分區/dev/sdb1掛載到/mnt上。 卸載 既然可以掛載,那當然也可以卸載。 實踐: 自動掛載 我們也可以做到在系統啟動的時候自動掛載,就像windows系統一樣。 實踐:先卸載/dev/sdb1的掛載,然後設置為自動掛載。 輸入命令:reboot重啟系統,然後 ...
  • 回到目錄 我們在進行docker swarm部署高可用集群時,在yml文件里可能要配置一些服務,而這些服務可能要使用一些公用的資料庫,這些資料庫可能已經運行在某個容器里,而這些容器有自己的網路,docker inspect 容器ID 來查看容器所使用的網路,使用docker network ls來查 ...
  • 本文目錄: 1.1 概述 1.2 RPC不可不知的原理 1.2.1 RPC原理 1.2.2 RCP工具介紹 1.3 啟動NFS 1.4 配置導出目錄和掛載使用 1.4.1 配置NFS導出目錄 1.4.2 掛載NFS文件系統 1.4.3 NFS偽文件系統 1.5 showmount命令 1.6 NFS ...
  • 曾經最喜歡Fedora 版本的Linux,但是因為現在Fedora的界面實在太花里胡哨了,所以最近開始搗鼓CenOS,本來 RedHat的EL版本也是一個不錯的選擇,最後想想還是用社區版的。 話說CentOS本身自帶的文檔閱讀器可以閱讀PDF文件,但是沒有手型工具,這個體驗實在是不好,因此自己打算安 ...
  • 原生bash不支持簡單的數學運算,但是可以通過其他命令來實現,例如 awk 和 expr,expr 最常用。 expr 是一款表達式計算工具,使用它能完成表達式的求值操作。 例如,兩個數相加(註意使用的是反引號 ` 而不是單引號 '): #!/bin/bash val=`expr 2 + 2` ec ...
  • 我們可以在執行 Shell 腳本時,向腳本傳遞參數,腳本內獲取參數的格式為:$n。n 代表一個數字,1 為執行腳本的第一個參數,2 為執行腳本的第二個參數,以此類推…… 以下實例我們向腳本傳遞三個參數,並分別輸出,其中 $0 為執行的文件名: #!/bin/bash echo "Shell 傳遞參數 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...