单细胞测序分析的流程之一 —— 细胞注释,过程详解
细胞注释是单细胞测序分析中至关重要的步骤,目的在于将细胞簇转换为具有生物学意义的特定细胞类型。此过程有助于揭示细胞的多样性及其功能,为后续生物学研究指明方向。
细胞注释主要有两种方法:人工注释和机器注释。
人工注释流程:
- 寻找Marker基因。
- 通过文献或数据库查找Marker基因对应的具体细胞类型。
- 对细胞簇进行注释。
机器注释流程:
- 加载并安装必要的软件包。
- 对细胞进行自动化注释。
- 通过可视化工具展示注释结果。
人工注释需要大量专业知识和时间,而机器注释虽然方便,但在精细亚群的准确性上可能有不足。通常建议结合两者,机器注释用于初步分类,人工注释用于细致准确的核实。
细胞注释在单细胞测序分析中扮演了重要角色,有助于深入
单细胞测序分析的流程之一 —— 细胞注释,过程详解
细胞注释是单细胞测序分析流程中的关键步骤,其目的是将细胞簇转换为具有生物学意义的具体细胞类型。这一过程有助于揭示细胞的多样性和功能,为后续的生物学研究提供有价值的方向。
细胞注释主要分为两种方法:人工注释和机器注释。
人工注释流程如下:
- 寻找Makers基因
- 通过文献查询或数据库查找Makers基因对应的具体细胞类型
- 对细胞簇进行注释
机器注释流程包括:
- 加载并安装必要的软件包
- 对细胞进行自动化注释
- 通过可视化工具展示注释结果
人工注释基于已知细胞类型的特征表达基因列表和相关通路进行,需要大量的专业知识和时间投入。而机器注释利用软件工具进行自动化操作,对小类亚群的精度可能不够高。
综合两种方法,通常先使用机器注释对细胞大群进行初步分类,然后人工手动对亚群进行详细注释,以提高准确性和精确度。
细胞注释是单细胞测序分析流程中的重要一环,有助于深入理解细胞的类型和功能。通过人工和机器注释的结合,可以有效提高分析效率和准确性。后续内容将深入讲解单细胞测序分析的后续步骤,敬请期待!
单细胞测序实用工具:细胞类型注释,这一篇就够了
细胞类型注释在scRNA-seq数据分析中扮演关键角色。传统方法需先聚类细胞,再根据典型差异表达基因进行注释,这一过程耗时且依赖先验知识。相比之下,自动注释工具具有快速简洁的优点。这类工具大致分为三种类型:基于Marker基因的注释、基于参考转录组的注释、以及使用监督学习方法。
接下来,我们将探讨三种常见自动注释工具——CellAssign、SingleR、以及CellTypist。
CellAssign是一种基于概率图模型的方法,它利用预先设定的Marker基因知识,通过推断细胞类型概率将未知数据分配到不同的细胞类型。这种方法在准确性和F1得分方面表现更佳,并能有效控制批次效应和样本效应。
SingleR通过将未知细胞的基因表达与参考数据集中的已知细胞类型进行相关性分析,确定每个单细胞的细胞类型。其注释过程包括独立注释每个单细胞、整合相关系数并去除最低相关性值的细胞类型,直至只剩下两个细胞类型为止。SingleR自带参考数据集,用户可进行注释操作。
CellTypist是一个用于自动注释人类组织中免疫细胞的工具,它整合来自不同组织的细胞数据,使用机器学习方法训练模型实现细胞类型的准确分类。该工具在不同细胞类型分类上的准确性达到约0.9,能识别包括T细胞、B细胞、单核巨噬细胞在内的不同细胞亚群。CellTypist既可以作为注释工具使用,也可以作为免疫细胞数据库。用户可通过命令行、Python环境或在线分析平台进行注释。
自动注释工具依赖于参考数据,且结果可能因所选参考数据的不同而变化。因此,在选择参考数据时需格外谨慎。注释工具还可分为细胞基于和簇基于两种类型,注释到单个细胞或簇。注释结果的准确率随参考数据中每种细胞类型的数量增加而提高。当参考数据中某一细胞类型数量较少时,使用单个细胞的注释方法可能不再适用。
不同研究给出了不同的结论,表明自动注释工具整体表现最好,但重要的是选择参考数据
单细胞测序分析的流程之一 —— 细胞注释,过程详解
细胞注释是单细胞测序分析流程中的关键步骤,其目的是将细胞簇转换为具有生物学意义的具体细胞类型。这一过程有助于揭示细胞的多样性和功能,为后续的生物学研究提供有价值的方向。
细胞注释主要分为两种方法:人工注释和机器注释。
人工注释流程如下:
寻找Makers基因
通过文献查询或数据库查找Makers基因对应的具体细胞类型
对细胞簇进行注释
机器注释流程包括:
加载并安装必要的软件包
对细胞进行自动化注释
通过可视化工具展示注释结果
人工注释基于已知细胞类型的特征表达基因列表和相关通路进行,需要大量的专业知识和时间投入。而机器注释利用软件工具进行自动化操作,对小类亚群的精度可能不够高。
综合两种方法,通常先使用机器注释对细胞大群进行初步分类,然后人工手动对亚群进行详细注释,以提高准确性和精确度。
细胞注释是单细胞测序分析流程中的重要一环,有助于深入理解细胞的类型和功能。通过人工和机器注释的结合,可以有效提高分析效率和准确性。后续内容将深入讲解单细胞测序分析的后续步骤,敬请期待!
单细胞测序实用工具:细胞类型注释,这一篇就够了
细胞类型注释在scRNA-seq数据分析中扮演关键角色。传统方法需先聚类细胞,再根据典型差异表达基因进行注释,这一过程耗时且依赖先验知识。相比之下,自动注释工具具有快速简洁的优点。这类工具大致分为三种类型:基于Marker基因的注释、基于参考转录组的注释、以及使用监督学习方法。接下来,我们将探讨三种常见自动注释工具——CellAssign、SingleR、以及CellTypist。
CellAssign是一种基于概率图模型的方法,它利用预先设定的Marker基因知识,通过推断细胞类型概率将未知数据分配到不同的细胞类型。这种方法在准确性和F1得分方面表现更佳,并能有效控制批次效应和样本效应。
另一个工具SingleR,通过将未知细胞的基因表达与参考数据集中的已知细胞类型进行相关性分析,确定每个单细胞的细胞类型。其注释过程包括独立注释每个单细胞、整合相关系数并去除最低相关性值的细胞类型,直至只剩下两个细胞类型为止。SingleR自带参考数据集,用户可进行注释操作。
CellTypist是一个用于自动注释人类组织中免疫细胞的工具,它整合来自不同组织的细胞数据,使用机器学习方法训练模型实现细胞类型的准确分类。该工具在不同细胞类型分类上的准确性达到约0.9,能识别包括T细胞、B细胞、单核巨噬细胞在内的不同细胞亚群。CellTypist既可以作为注释工具使用,也可以作为免疫细胞数据库。用户可通过命令行、Python环境或在线分析平台进行注释。
自动注释工具依赖于参考数据,且结果可能因所选参考数据的不同而变化。因此,在选择参考数据时需格外谨慎。注释工具还可分为细胞基于和簇基于两种类型,注释到单个细胞或簇。注释结果的准确率随参考数据中每种细胞类型的数量增加而提高。当参考数据中某一细胞类型数量较少时,使用单个细胞的注释方法可能不再适用。
不同研究给出了不同的结论,表明自动注释工具整体表现最好,但重要的是选择参考数据的质量以及与待注释样本的匹配性。Zoe A. Clarke等人建议的步骤包括:首先尝试使用自动注释方法,以快速进行细胞注释;若结果不准确或存在冲突,则进行手动注释;最后,对注释结果进行独立验证。
综上所述,自动注释工具在scRNA-seq细胞类型注释中发挥了重要作用。选择合适的工具和参考数据,结合自动和手动注释方法,可以提高注释结果的准确性。在进行细胞类型注释时,需考虑工具的性能、参考数据的质量以及与样本的匹配性。
scRNA复现-惊艳的细胞注释umap图
各位小伙伴早上好呀~,昨天是平安夜,有没有出门玩呀,小编在家宅了一天,看见票圈很多人出门玩,拍了好看的照片,在家里也感受到了浓浓的欢乐氛围, 好好的休息了一下今天就周一啦
今天我们要学习的内容是scRNA复现精美umap图,下面我们一起来看下吧
已知单细胞常见的可视化方式有DimPlot,FeaturePlot ,DotPlot ,VlnPlot 和 DoHeatmap集中 ,在Seurat中均可以实现,本次再介绍一种更惊艳的umap图。
2022年发表于Cell Metabolism 的Mapping the single-cell transcriptomic response of murine diabetic kidney disease to therapies 文献中有一张主图中绘制的细胞大群及亚群的umap图很惊艳,作者提供了plot1cell,今天我们可以来学习下如何复现下图。
一 载入R包,数据
使用之前注释过的sce.anno.RData数据 ,私信 anno 即可获取 。这里要下载一下plot1cell图,大概率会提示缺少XXX包,这时候只要指定安装即可。
已经注释过了,下面可以直接使用。
二 plot1cell 函数
1,绘制大群umap图
首先使用prepare_circlize_data函数得到绘图信息,然后plot_circlize函数可以直接绘制umap主图 并把单独的celltype圈画起来 。
对比文章图 还缺少(1)背景颜色 ,(2)circos字体较小,(3)外面其他的圈 以及(4)四周的亚群umap图。
2,背景颜色以及circos大小设置
作者的plot_circlize函数中,将circos图中的刻度和label的大小固定了,需要简单修改一下就可以修改了。修改后的plot_circlize_change 函数可以使用circos.cex 修改circos刻度的大小 , labels.cex 修改circos上label的大小 。
私信"circos" 即可获得plot_circlize_change 函数文件。
3,添加多层track
使用add_track函数添加其他细胞群注释的其他信息 ,可是是metadata中的其他列,这里使用group 和 sample 为例 。
到这里就完成了主图umap的绘制,其实就可以放到正文了。
三 添加细胞亚型umap
至于最后一点,其实可以用将AI / PS等工具将各个亚型小图的umap PS弄上去,但是这里还是给出使用代码的方式。
1 ,批量亚型分析
因为亚型之前没有分析,这里先批量的进行一下各个亚型的标准Seurat分析(本文不做注释,后续会介绍)
得到的是各个亚型的结果,list形式。
2 ,添加四周亚型umap图
注意这里的subcolors 可以自定义,也可以每次都使用my36colors 中的颜色,但是一定要注意以下2点
(1) subcolors 要和 Idents(Fibroblast)中的nlevels一致。
(2)Fibroblast_meta$x*0.32-1.2和后面Fibroblast_meta$y*0.32-0.73 中的 0.32 ,1.2 ,0.73等 数值代表位置,可能需要多次尝试。
3 ,添加四周umap的title 和 track的legend
(1)添加,优化四周umap的title ,注意位置和大小
(2)添加track的legend
github.com/TheHumphreys...
那我们的学习今天到这里就结束啦,有问题或对多组学感兴趣的可以私信联系我哟~
细胞注释之marker列表
近期由于专注于经典marker的整理与总结,更新较少。经过测试,我搜集的marker配合clustermole的自动化分析,在定义细胞类型上表现良好。在单细胞分析成熟后,理解每个cluster的细胞类型是关键,这需要通过细胞注释来实现,通常分为自动注释、手动注释和验证三个步骤。
自动注解是快速工具,通过算法识别特征基因表达,为细胞分配标签。分为两种方法:marker-based annotation(基于marker基因注释)和reference-based或Correlation-based annotation(基于参考数据集注释)。然而,自动注释的准确性有时受限,此时需要人工干预,检查和补充缺失或有误的注释。
手动注释是黄金标准,但耗时且主观。首先,了解样本中主要细胞类型,然后利用Marker Gene list(如CellMarker, HCA, PanglaoDB等)辅助,通过基因表达可视化确定细胞类型。例如,MS4A1和CD79A在B细胞中高表达,可据此命名cluster。但需注意doublet可能带来的影响。
验证是确保注释可靠性的关键步骤,尤其对于新或稀有细胞类型。多组学实验如TCR和B细胞受体克隆分型用于进一步细化细胞类型标签。
分享的单细胞空间文献中包含大量marker列表,包括人和小鼠的细胞亚类marker,但由于整理耗时较长,建议大家根据需要自行斟酌。细胞注释虽然具有挑战性,但通过不断积累和实践,我们可以逐步完善这一过程。