【NGS 次世代基因體資料科學】使用seqtk對FASTQ降採樣

在一些QC工作的時候,我們會需要從完整的定序結果中抽樣一些reads來做處理。而seqtk是目前比較主流的tool,這裡簡單介紹如何安裝和使用它來做FASTQ的抽樣。
下載&編譯seqtk
git clone https://github.com/lh3/seqtk.git
cd seqtk
make
./seqtk
也可以用conda安裝:
conda install -c bioconda seqtk
用seqtk降採樣PE 的FASTQ
都取10000個reads:
./seqtk sample -s100 read1.fq 10000 > sub1.fq
./seqtk sample -s100 read2.fq 10000 > sub2.fq
參考:https://www.biostars.org/p/6544/
A passionate bioinformatician focuses on the next generation of medical science and biotechnology.
喜歡這樣的教學創作的話,歡迎 小額贊助 給予支持🙏