看了那么多生信文章,小云依旧认为:单基因分析之于生信,就像董宇辉之于东方甄选,它就是生信思路大军中的基石~
单基因分析因其“分析思路比较简单、新手小白好上手”,被首推为新手村选手的入门思路,同时也因为它“进可攻(生信单独成文)退可守(生信结合湿实验形成大课题)”,又成为很多大课题的黄金配角,思路应用相当广泛,助力小伙伴们轻轻松松实现省钱提分大计!(ps:小云前面已经分享过了多种单基因分析思路,感兴趣的小伙伴欢迎进入公众号搜索或点击文末链接观看哦)
既然如此,小云今天就分享一下南昌大学第一附属医院谢勇教授团队最新发表的一篇“堪比董宇辉”的7分+单基因分析文章,为什么说它堪比董宇辉,跟着小云往下看:
1)选题创新:文章将胃癌致病因素幽门螺杆菌感染与铁死亡热点结合,选题既与疾病密切相关,又紧贴热点,创新性满分;
2)分析方法创新:应用多组学分析、分子对接、10种机器学习算法和单细胞分析等,分析方法之丰富,buff多到审稿人都称绝;
3)干湿结合:利用临床组织样本进行基因的表达验证,干湿结合符合生信大趋势,更受杂志青睐。
这么看来,文章既有大热点、有关注度,又有超级丰富的分析方法叠buff,还有备受杂志喜爱的干湿结合验证,是不是像极了大受广大“丈母娘”喜爱、博学多识的董宇辉老师呢!想要单基因思路的小伙伴赶快来学习啦,这个思路复现出来你也可以轻松拿高分,需要复现/设计思路或定制生信分析的朋友,欢迎扫码联系小云哦~
- 题目:通过多组学整合、分子对接和机器学习综合分析胃癌中幽门螺杆菌相关铁死亡基因YWHAE的功能
- 杂志:Apoptosis
- 影响因子:IF=7.2
- 发表时间:2023年11月
研究背景
胃癌与幽门螺杆菌感染密切相关。然而,对于幽门螺杆菌感染背景下胃癌发生的分子机制,尤其是与铁死亡相关的分子机制,仍知之甚少。
数据来源
数据集 | 来源 | 数据类型 | 样本信息 |
PRJNA703469 | NCBI | RNA-seq数据+临床信息 | 幽门螺杆菌相关胃炎(32份幽门螺杆菌阳性样本和8份幽门螺杆菌阴性样本)以及胃癌(32份幽门螺杆菌阳性样本和8份幽门螺杆菌阴性样本) |
GSE13195 | GEO | RNA-seq数据+临床信息 | 25份胃癌样本和25份正常样本 |
TCGA-STAD | TCGA | RNA-seq数据+临床信息 | 胃癌样本 |
铁死亡相关基因 | ferry db V2 | 基因集 | 564个铁死亡基因 |
研究思路
作者首先基于PRJNA703469队列进行差异基因分析,得到胃癌和胃炎中幽门螺杆菌相关DEGs,然后再与铁死亡相关基因取交集,得到YWHAE基因,并在GEPIA2和GSE13195数据集中验证其表达。接下来进行YWHAE的泛癌分析,利用TIMER2.0数据库分析泛癌表达,通过TISCH数据库分析YWHAE与生存结果的相关性,利用GSCA数据库评估其基因组改变。基于TISCH数据库的单细胞数据分析YWHAE在细胞水平的表达。在TCGA-STAD队列中筛选YWHAE相关基因并构建PPI网络,利用10种机器学习算法评估YWHAE相关基因的预后意义,建立预后模型并进行评估和验证。利用cibersort等算法分析YWHAE高低表达组间的免疫浸润情况和免疫治疗反应差异。比较两组间的药敏性,筛选治疗药物并与YWHAE进行分子对接分析。最后,在临床组织样本和HPA数据库中验证YWHAE基因表达。
图1 研究流程图
主要结果
1. YWHAE基因的鉴定
首先基于PRJNA703469队列进行差异基因分析,分别得到380个胃炎中幽门螺杆菌相关DEGs,586 个胃癌幽门螺杆菌相关DEGs,然后再与564个铁死亡相关基因取交集,得到YWHAE基因(图2A),并在GEPIA2(图2B)和GSE13195数据集(图2C)中验证其表达。
图2 YWHAE基因的鉴定
2. YWHAE基因的泛癌分析
基于Timer 2.0、TISCH和GSCA数据库,作者对YWHAE基因进行泛癌分析。Timer 2.0数据库分析结果显示,YWHAE基因在膀胱尿路上皮癌(BLCA)等多个癌种中表达上调(图3A),TISCH中的生存分析显示YWHAE 基因表达是胆管癌(CHOL)、肉瘤(SARC)和肺腺癌(LUAD)患者的预后风险因素(图3B)。基于GSCA数据库的基因组改变分析显示,有 29 种癌症的 CNV 与 YWHAE 基因表达呈正相关(图3D),在 28 种癌种中甲基化与 YWHAE 基因表达呈负相关(图3F)。
图3 YWHAE基因的泛癌分析
3. YWHAE基因的单细胞分析
利用 TISCH 数据库中的 GSE134520 数据集分析了 YWHAE 基因在不同细胞类型中的表达情况。结果显示,共鉴定出9个细胞群(图4A),YWHAE 主要在凹坑粘液细胞、恶性细胞和成纤维细胞中表达(图4B)。此外,作者还比较了按样本来源分层后不同细胞群中 YWHAE 的表达水平,图 4C 显示了在 DC 细胞中 YWHAE 有显著差异表达。按幽门螺杆菌感染分层后, 显示了 YWHAE 在成纤维细胞等中有显著差异表达(图 4D)。
图4 YWHAE基因的单细胞分析
4. 功能富集分析
作者利用 TCGA-STAD 样本进行了Spearman相关性分析,确定了与 YWHAE 关系最密切的前 20 个基因,并构建PPI网络(图5A)。然后根据 YWHAE 在 STAD 中的中位表达水平将样本分为高、低表达组,组间差异分析得到265个DEGs,针对DEGs进行GO和KEGG富集分析,显示富集于”PI3K-Akt “和 “ECM-受体相互作用 “等通路(图 5D)。
图5 功能富集分析
5. 药敏性分析和分子对接
作者比较了常用化疗药物在YWHAE高、低表达组之间的疗效差异,显示低表达组中博来霉素、顺铂、依托泊苷和索拉非尼的 IC50 值明显更高(图6A)。此外,作者还将两组之间的DEGs列表上传到 Clue 平台,从而预测出六种在 STAD 治疗中具有潜在作用的小分子化合物(图6B-F)。对五种关键药物(CI-1040、尼罗替尼、PD-0325901、RDEA119和Selumetinib)与YWHAE进行了分子对接(图6G-H)。
图6 药敏性分析和分子对接
6. 免疫浸润和免疫治疗反应分析
作者在TCGA-STAD数据集中采用cibersort、mcp、xcell和quantiseq等算法分析YWHAE与免疫微环境之间的关联。结果显示YWHAE高、低表达组间不同免疫细胞亚型存在不同比例,表明多种免疫细胞的组成存在差异(图7C)。此外,采用了ESTIMATE算法来评估肿瘤微环境评分,结果显示,与高表达组相比,低表达组的基质和ESTIMATE得分明显更高,而低表达组的肿瘤纯度较低(图7D)。进一步评估高、低表达组的 TIDE 评分、功能障碍、微卫星不稳定性(MSI)和排异性,发现两组在 MSI 和功能障碍方面存在差异(图 7E)。最后,比较高、低表达组间的免疫治疗反应差异,结果发现,高表达组的 CR/PR(完全应答/部分应答)比例高于低表达组(图7I)。
图7 免疫浸润和免疫治疗反应分析
7. 机器学习建立YWHAE相关预后模型
通过Spearman相关性分析,共发现 557 个基因与 STAD 中的 YWHAE 呈正相关,其中包含31 个与预后相关的基因。随后以TCGA-STAD为训练集,以GSE62254等为验证集,应用10种机器学习算法和101种整合组合(包括弹性网络(Enet)、Lasso、随机生存森林等)建立了预后模型。根据评价指标 C-index,作者选择 Enet[0.2] 作为最终算法(图 8A),并利用 Enet[0.2] 确定了 14 个用于构建预后模型的基因(图 8B, C)。计算STAD 患者的风险评分并根据中位风险评分将患者分为高、低风险组,KM生存分析显示高风险组的死亡率更高(图 8D),ROC曲线显示模型的预测性能良好(图8E)。此外,作者还在独立验证集中验证了风险模型的预后能力,KM曲线显示验证集中高风险组死亡率更高(图8F),ROC曲线显示其准确的预测性能(图8G)。
图8 机器学习建立YWHAE相关预后模型
8. YWHAE的表达验证
作者用qRT-PCR方法检测了9对胃癌组织及其相应癌旁组织中YWHAE的mRNA表达水平。结果显示,与癌旁组织相比,YWHAE在胃癌组织中的表达量明显较高(图 9A)。此外,从 HPA 数据库中获得了 YWHAE 基因的蛋白表达数据。经 IHC 检测证实,YWHAE 蛋白表达与 mRNA 表达呈相同趋势,与正常组织相比,胃癌组织中的 YWHAE 蛋白表达水平更高(图 9B)。
图9 YWHAE的表达验证
文章小结
这篇内容丰富度堪比“董宇辉”的文章有没有惊艳到你呀?一篇文章既有铁死亡这样的国自然/生信大热点,又有多组学、单细胞、机器学习等超级丰富的分析方法叠buff,还有备受杂志喜爱的干湿结合验证,这实力拿到7分+可是毋庸置疑了~不管是新手小伙伴们想入门还是大课题想结合一点生信,“单基因”方向仍是你的高性价比之选!需要思路复现、设计、定制分析的小伙伴快扫描下方二维码联系小云吧,早上车早发文哟~
想了解更多生信思路请持续关注小云公众号哦,需要复现或定制分析思路的朋友欢迎call小云,风里雨里小云公众号等你!