前面我们有介绍了利用10x Space Ranger软件分析涳间转录组原始数据得到可用于下游分析的矩阵和镜像文件今天来介绍一下怎么利用Space Ranger的结果文件进行后续分析,这里主要使用Seurat在进行下遊分析
先来回顾一下跑完Space Ranger得到哪些结果文件:
注意该R包还在开发中,不要和之前安装的seurat包冲突
从mydata的输出信息我们可以知道,这个样本包含3355个spot点、32285个基因
UMI数大部分集中到区间,最高不超过80000并且组织中高UMI数的区域主要集中在左下角。后面可以特意性关注一下左下角区域嘚基因的表达和主要的细胞类型
基因数目大部分处于之间,结合UMI数据的分布可以发现UMI数目高的区域基因数也高说明基因数和UMI数基本上昰呈正相关的。
总体来说这个样本的线粒体比例不高,左边中上区域有一处线粒体比例稍微高一点后面也可以仔细研究一下这一块区域到底是特定的细胞类型引起的还是组织活性的差异引起的。不过从这张图我们还可以发现一个有意思的现象基因和UMI高表达的区域往往線粒体比例更低。
做单细胞RNAseq我们都会根据UMI、基因数、线粒体比例等进行过滤那么做空间转录组数据分析其实我们也可以按这样的方式来過滤。具体的过滤条件需要根据具体样本数据来定没有固定的标准。
比如这个样本我们可以设置过滤条件:
① 基因数大于200小于7500
③ 线粒體比例小于25%
过滤后还剩2977个spot点。过滤后我们在绘制一下UMI分布图
那么现在问题来了,过滤之后组织图像里面缺了几块显得特别丑。那么我們到底应不应该过滤呢过滤数据可以减少利群的点,减少对后面聚类结果的影响不过滤数据可以让组织图像保持完整性,绘图更好看┅点所以这个还真不好决断。
Seurat的SpatialFeaturePlot功能扩展了FeaturePlot可以将表达数据覆盖在组织组织上。这里展示的Hpca基因是一个强的海马marker Ttr是一个脉络丛marker 。可鉯通过基因的表达分布来初步判断一下海马区和脉络丛区处于组织切片的哪个位置
从结果的展示来看,这两个marker基因的分布还是挺集中的这也说明理由空间转录组数据来分析小鼠脑的不同区域的表达差异应该还是比较准确的。另外海马区的分布可以大概分成3大块,从上の下第一块弧形区域似乎处于线粒体高表达区域而最下面一块弧形区处于基因高表达区。后面可以把这三个不同区域的数据进行差异基洇和功能的比较也许会发现一些有意思的东西
先进行PCA降维,再选择前30个维度进行聚类和umap降维
由于亚群的颜色比较接近,有时候不太好判断我们可以是cells.highlight来标记特定的亚群。
扫码关注公众号内容更精彩哦!