用于细胞亚群发现的 CCST 工作流程
1) 以单细胞位置和基因表达信息作为输入,CCST首先将空间数据编码为两个矩阵。一个是基于细胞邻域的混合邻接矩阵,其中一个超参数λ用于平衡细胞内(基因)和细胞外(空间)信息(方法),而另一个是单细胞基因表达谱矩阵;
2) 这两个矩阵都被输入DGI网络,为每个细胞计算出一个嵌入向量。DGI采用了一系列的GCN层,这使得它能够将图(细胞位置)和节点属性(基因表达)都整合为节点(单细胞)的嵌入向量。图中的边缘也进行了排列,以产生没有任何空间结构信息的负节点嵌入向量;
3) 在训练区分这两种嵌入类型后,CCST学会了编码一个包含空间结构和基因表达信息的细胞节点嵌入。通过主成分分析(PCA)降维后,使用k-means++算法进行节点聚类,以识别细胞组或亚群。