【Single-Cell Sequencing 單細胞定序】10X Genomics CMO的Demultiplexing

CMO是指Cell Multiplexing Oligo (CMO),是10X 的 feature barcode,在細胞進入GEM之前進行標記,通常用來區分read的類型(例如:一組是treated,一組normal),這裡介紹下機之後,要如何手動做read的demultiplexing拆分,把read按照CMO的標記分組。
CMO格式
CMO 的R2 前15個bp(也就是0-14)是 feature barcodes,就是用來區分不同sample的序列,其種類有CMO301-CMO312總共有12種。具體內容可以下載自
https://support.10xgenomics.com/csv/default_cmo_ref.csv
按照10X的說明文件:
https://assets.ctfassets.net/an68im79xiti/6G2iPa3N9L3ZtsSCJlR3yO/
dd9e4749ebb7f7894
f193db1ddd148bb/CG000388
_ChromiumNextGEMSingle
Cell3-v3.1_CellMultiplexing_RevB.pdf
,的p75說明圖表,其後面會接著Capture Sequence 2,其為一串固定的22bp的序列,也就是下圖中的GCTCACCTATTAGCGGCTAAGG。(由右往左看)

接下來就是12bp的UMI,以及10X cell Barcode37-64,上述整理成下表,可以對應上圖的圖示(由右往左看)
- 0-14 : CMO feature barcodes(N15)
- 15-36 : Capture Sequence 2 (GCTCACCTATTAGCGGCTAAGG)
- 37-48 : UMI(N12)
- 49-64 : 10X barcodes(N16)
了解CMO的格式之後,就可以用程式做demultiplexing了。