CNV究竟是细胞的福音还是噩梦?单细胞转录组数据到底有多复杂?今天,用 infercnv包为你答疑解惑!






CNV究竟是细胞的福音还是噩梦?单细胞转录组数据到底有多复杂?今天,用 infercnv包为你答疑解惑!

小果  生信果  2024-05-09 19:01:24

同学们,今天小果要向大家介绍一个超级重要的工具!它就是转录组学研究中的“神器”——infercnv包!infercnv包可是转录组学中专门帮我们进行细胞类型推断和拷贝数变异(CNV)分析的必备工具。首先什么是拷贝数变异(CNV)呢?就让小果来告诉你吧,CNV指的是基因组中较大片段DNA的拷贝数变化,它可能与疾病的发生和发展相关。通过分析单细胞RNA-seq数据,infercnv能够检测细胞间的CNV变异,帮助我们识别基因组结构的差异,这对于研究细胞类型、揭示疾病机制和探索个体差异具有重要意义。
在本次课程中,我们将逐步学习如何安装和使用infercnv包进行细胞类型推断和CNV分析,并探讨其在转录组学研究中的应用。通过实际的示例和演示,同学们将了解如何准备数据、运行分析,并理解细胞类型推断和CNV分析对转录组学研究的重要性。相信我,通过今天的分享,同学们都能成为使用infercnv包的高手!接下来,就让我们正式开启对infercnv包的学习之旅,共同探索转录组学研究的新前沿吧!             
本次介绍的R包需要较多的硬件资源,在服务器可以更加流畅运行,同学们如果没有自己的服务器欢迎联系我们使用服务器租赁~



公众号后台回复“111”

领取本篇代码、基因集或示例数据等文件

文件编号:240423

需要租赁服务器的小伙伴可以扫码添加小果,此外小果还提供生信分析,思路设计,文献复现等,有需要的小伙伴欢迎来撩~

infercnv包介绍
infercnv是一个用于单细胞转录组数据分析的R包,主要提供细胞类型推断和拷贝数变异(CNV)分析功能。CNV是指基因组中较大片段DNA的拷贝数变化,可能与疾病发生和发展相关。infercnv通过分析单细胞RNA-seq数据,可以检测细胞间的CNV变异,帮助识别基因组结构差异。这对于研究细胞类型、疾病机制和个体差异具有重要意义,有助于揭示基因组变异对细胞功能和表型的影响。通过infercnv包,用户可以深入探究单细胞数据中的CNV情况,为理解细胞间差异提供有力支持。   
infercnv包及其扩展安装
infercnv包安装
需要R语言版本为4.3,在控制台中输入以下命令:
if (!require("BiocManager", quietly = TRUE))    install.packages("BiocManager ")    BiocManager::install("infercnv") # 在BiocManager环境下安装infercnv
infercnv所需要的依赖包较多,请同学们安装时,耐心等待。
查看是否安装成功
packageVersion("infercnv") # 查看infercnv版本
显示为1.18.1版本,则表示已经安装了infercnv包。
扩展安装:
如果同学们想使用热图对结果可视化,需要在安装软件包 tibble、tsvio 和 NGCHMR 后再安装扩展包 R inferCNV_NGCHM。若要安装扩展包,请在 R 命令窗口中键入以下命令:
install.packages("tibble") # 安装tibble包install.packages("devtools") # 安装devtools包devtools::install_github("bmbroom/tsvio") # 安装tsviodevtools::install_github("bmbroom/NGCHMR", ref="stable") # 安装 NGCHMRdevtools::install_github("broadinstitute/inferCNV_NGCHM") #安装inferCNV_NGCHM
所需要安装时间较长,希望同学们耐心等待。    
          
infercnv包使用示例
数据准备:
读取原始计数矩阵和元数据,填充 infercnv 对象
library(infercnv) # 载入infercnv包setwd("/R-4.3.3/library/infercnv/extdata") # 需要更换为自己R的安装位置infercnv_obj <- CreateInfercnvObject(raw_counts_matrix = "./oligodendroglioma_expression_downsampled.counts.matrix.gz", # 载入原始数据annotations_file = "./oligodendroglioma_annotations_downsampled.txt", # 载入注释文件delim = "t",gene_order_file = "./gencode_downsampled.EXAMPLE_ONLY_DONT_REUSE.txt", # 载入基因目录文件ref_group_names = c("Microglia/Macrophage", "Oligodendrocytes (non-malignant)"))使用infercnv包进行基因拷贝突变数分析:class(infercnv_obj) # 查看infercnv_obj对象类型
out_dir = getwd()infercnv_obj_default = infercnv::run(    infercnv_obj,  # 使用之前创建的infercnv对象infercnv_obj作为输入    cutoff=1,  # 设置用于过滤细胞的表达量阈值,cutoff=1适用于Smart-seq2数据,cutoff=0.1适用于10x Genomics数据    out_dir=out_dir,  # 指定输出结果的文件夹路径,out_dir是您之前定义的输出目录变量    cluster_by_groups=TRUE,  # 根据指定的参考组进行细胞群集分析    plot_steps=FALSE,  # 是否绘制分析步骤的图表,设置为FALSE表示不绘制    denoise=TRUE,  # 是否对数据进行去噪处理,设置为TRUE表示进行去噪    HMM=FALSE,  # 是否使用隐马尔可夫模型(Hidden Markov Model)进行分析,设置为FALSE表示不使用    no_prelim_plot=TRUE,  # 是否绘制预处理后的细胞图谱,设置为TRUE表示不绘制    png_res=60  # 设置输出PNG图像的分辨率为60dpi    )
代码运行需要较长时间,最后运行结束如图所示:
此时,本次分析的结果会输出到我们的工作目录,可以使用getwd()命令查看工作目录所在位置,打开工作目录,会看到两张图片的输出结果,如下图:
其中infercnv_subclusters.png图像更为清晰,显示如下图:    
由图可知,蓝色表示单细胞转录组对应位置RNA表达下调,红色表示单细胞转录组对应位置RNA表达上调,可以理解为基因拷贝数变异(CNV)。则可以看到示例细胞中,绝大多数在1号染色体前半部分区段和19号染色体的后半部分区段均出现了下调,部分细胞在7号染色体和11号染色体的部分区段出现了下调,其余部分没有较为明显的上调。
          
以上就是对infercnv包的全部介绍了,通过本次学习,我们深入了解了infercnv包在单细胞转录组数据分析中的重要作用。在使用infercnv包的过程中,我们不仅学会了如何安装和使用该包,还掌握了对单细胞数据进行基因拷贝数变异分析的具体步骤。通过对示例数据的分析,我们更进一步理解了细胞间的CNV变异情况,并通过可视化结果直观地展示了分析的成果。小果希望同学们能够充分利用infercnv包这一强大工具,探索更多有关单细胞转录组数据的奥秘,为生物学研究做出更大的贡献。让我们携手并进,共同探索科学的无限可能,为人类健康和生命科学的发展贡献自己的力量!    
          
同学们如果觉得自己写代码麻烦,可以体验一下我们的云生信小工具,只需输入数据,即可轻松生成所需图表。立即访问云生信
http://www.biocloudservice.com/home.html),开启便捷的生信之旅!
   

小果还提供思路设计、定制生信分析、文献思路复现;有需要的小伙伴欢迎直接扫码咨询小果,竭诚为您的科研助力!


定制生信分析

服务器租赁

扫码咨询小果



往期回顾

01

1024G存储的生信服务器,两人成团,1人免单!

02

单个数据库用腻了?多数据库“组合拳”带你打开免疫浸润新思路!

03

孟德尔随机化的准备工作,GWAS数据的网站下载方法

04

跟着小果学复现-手把手带你拿下IF=46.9Nature 级别的主成分分析(PCA)图!!