NGS-based methods and Data Science

【NGS 次世代基因體資料科學】使用seqtk對FASTQ降採樣

在一些QC工作的時候,我們會需要從完整的定序結果中抽樣一些reads來做處理。而seqtk是目前比較主流的tool,這裡簡單介紹如何安裝和使用它來做FASTQ的抽樣。

下載&編譯seqtk

git clone https://github.com/lh3/seqtk.git
cd seqtk
make
 ./seqtk

也可以用conda安裝:

conda install -c bioconda seqtk

用seqtk降採樣PE 的FASTQ

都取10000個reads:

./seqtk sample -s100 read1.fq 10000 > sub1.fq
./seqtk sample -s100 read2.fq 10000 > sub2.fq

參考:https://www.biostars.org/p/6544/

Leave a Reply

Your email address will not be published. Required fields are marked *

en_USEnglish