【原】处理前后不知道具体细胞亚群是状态还是数量变化？

健明 2023-05-05 发布于广东

展开全文

如果处理前后可以做单细胞转录组，那么很容易看细胞比例变化，也可以差异分析后具体单细胞亚群的状态变化。但是单细胞比较费用比较高，单个样品单细胞费用1万但是它普通转录组500即可，20倍的价格差距会让绝大部分课题首选仍然是传统转录组测序。

实际上传统转录组测序也可以推断具体细胞亚群是状态或者数量变化，比如2020的文章：《FAM3D is essential for colon homeostasis and host defense against inflammation associated carcinogenesis》，就是一个简单的转录组，干扰基因前后每个分组3个样品，数据在PRJNA641502，仅仅是释放了测序文件，并没有提供表达量矩阵。不过很容易下载fq文件进行定量啦，转录组数据分析临床基本上人人都掌握了。

Run Instrument LibrarySelection
SRR12079318 Fam3D KO
SRR12079321 WT WT
SRR12079322 WT WT
SRR12079323 WT WT
SRR12079319 Fam3D KO
SRR12079320 Fam3D KO

常规定量后的矩阵可以根据两个分组进行差异分析，作者首先使用了一个热图来说明 host defense responses 里面的大量基因在干扰了Fam3D后的小鼠分组里面是下调的（我很喜欢这样的热图，小巧而且不占据版面，方便发表成为sci文章）

host defense responses 里面的大量基因在干扰了Fam3D后的小鼠分组里面是下调的

差异分析后需要有功能富集，这个时候作者并没有展现常规的go和kegg数据库里面的功能，而是根据自己的生物学背景，挑选了2017的Nature文章《R-spondin ligands during Lgr5 (+) intestinal stem-cell self-renewal》里面的多个单细胞亚群功能基因集合，包括：stem cell, transit-amplifying cell, enterocytes, goblet cell, Paneth cell, tuft cell, and enter- oendocrine cell.

并没有展现常规的go和kegg数据库里面的功能

通过上面的GSEA富集结果可以看到 the goblet cell signature were specifically enriched in Fam3D−/− mice

但是研究者这个时候并不能确定到底是enhanced goblet cell activation还是 increased representation of this lineage in the colonic epithelial

其实有大量的软件，可以根据单细胞亚群的特征基因和表达量信息，去传统的bulk转录组数据里面进行去卷积推断比例，前面的传统的bulk转录组二分组差异分析虽然是可以gsea富集到 goblet cell 基因列表是正向富集，但是不能区分是具体细胞亚群是状态还是数量变化，如果加上去卷积推测细胞比例，就可以弥补这个缺失的环节。

当然了，如果有经费直接做单细胞是更好的啦，就会很容易看细胞比例变化，也可以差异分析后具体单细胞亚群的状态变化。但是单细胞也有一个麻烦的地方，就是它得到的单细胞比例其实并不可靠，因为受样品制备实验细节的干扰很大，而且这样的两个分组每个组就3个样品，无论是表达量比例变化还是基因通路变化的统计学都很难可靠。