实际上传统转录组测序也可以推断具体细胞亚群是状态或者数量变化,比如2020的文章:《FAM3D is essential for colon homeostasis and host defense against inflammation associated carcinogenesis》,就是一个简单的转录组,干扰基因前后每个分组3个样品,数据在PRJNA641502,仅仅是释放了测序文件,并没有提供表达量矩阵。不过很容易下载fq文件进行定量啦,转录组数据分析临床基本上人人都掌握了。
常规定量后的矩阵可以根据两个分组进行差异分析,作者首先使用了一个热图来说明 host defense responses 里面的大量基因在干扰了Fam3D后的小鼠分组里面是下调的(我很喜欢这样的热图,小巧而且不占据版面,方便发表成为sci文章) 差异分析后需要有功能富集,这个时候作者并没有展现常规的go和kegg数据库里面的功能,而是根据自己的生物学背景,挑选了2017的Nature文章《R-spondin ligands during Lgr5 (+) intestinal stem-cell self-renewal》里面的多个单细胞亚群功能基因集合,包括:stem cell, transit-amplifying cell, enterocytes, goblet cell, Paneth cell, tuft cell, and enter- oendocrine cell. 通过上面的GSEA富集结果可以看到 the goblet cell signature were specifically enriched in Fam3D−/− mice 但是研究者这个时候并不能确定到底是enhanced goblet cell activation还是 increased representation of this lineage in the colonic epithelial 其实有大量的软件,可以根据单细胞亚群的特征基因和表达量信息,去传统的bulk转录组数据里面进行去卷积推断比例,前面的传统的bulk转录组二分组差异分析虽然是可以gsea富集到 goblet cell 基因列表是正向富集,但是不能区分是具体细胞亚群是状态还是数量变化,如果加上去卷积推测细胞比例,就可以弥补这个缺失的环节。 当然了,如果有经费直接做单细胞是更好的啦,就会很容易看细胞比例变化,也可以差异分析后具体单细胞亚群的状态变化。但是单细胞也有一个麻烦的地方,就是它得到的单细胞比例其实并不可靠,因为受样品制备实验细节的干扰很大,而且这样的两个分组每个组就3个样品,无论是表达量比例变化还是基因通路变化的统计学都很难可靠。 生信服务(明码标价)我们一直有这样的按需付费的明码标价牵线活动,大量生信工程师比较擅长确定性的数据分析,比如你给定2个分组的转录组测序上游测序fq文件或者定量后的count矩阵,可以做差异富集等等,也可以做本文提到的去卷积推断细胞比例并且展示。(800元人民币) 也可以是两个分组的单细胞转录组,从表达量矩阵开始进行降维聚类分群和细胞比例变化和表达量差异分析,都是明码标价,单项分析800元人民币。
|
|