山东大学齐鲁医院团队一项基于8000多名患者分析!创新思路轻松拿下纯生信文章!

小云分享了这么久的生信分析思路,见过了大大小小的疾病数据集。相比于肿瘤相关数据来说,非肿瘤疾病的数据会少一些,尤其是小种疾病数据会更少,有时候只用1个数据集也能分析出一篇生信内容。

如果你关注的恰巧是常见癌种,那数据集就有很多选择了。当然,分析纳入的数据集越多,结果的可信度越高。

这不,小云发现了一篇山东大学齐鲁医院研究团队的文章,是基于15个独立队列8236例乳腺癌患者的转录组学数据进行的分析。这数据量着实少见,而且还有创新的生信方向“共刺激分子”助力,没有做实验就发表了7分+纯生信文章,一起来围观一下吧~

(如果没有分析思路也可以找小云帮忙,超多个性化的分析思路供你选择~)

题目:综合多组学分析揭示了共刺激分子评分对乳腺癌肿瘤侵袭性和免疫逃避的影响:一项涉及8000多名患者的大规模研究

杂志:Computers in biology and medicine

影响因子:7.7

发表时间:2023年6月

图片数据信息 图片

图片研究思路 图片

提取来自15个独立队列的8236例BC患者的全组织转录组学数据。构建了一个名为“共刺激分子评分”(CMS)的综合评分系统,并使用LASSO回归和随机生存森林算法进行了充分验证。研究了CMSs与肿瘤基因型及临床病理特征的相关性。研究人员进行了广泛的多组学和免疫基因组学分析,以调查和验证CMS、富集途径、潜在的内在和外在免疫逃逸机制、免疫治疗反应和治疗选择之间的关联。

图1 流程图

图片主要研究结果 图片

  1. CMS模型的建立与验证

采用单因素Cox比例风险回归分析确定与预后相关的共刺激分子。在筛选的60个基因中,22个基因与预后显著相关,其中18个基因被鉴定为保护因子,而4个基因被鉴定为危险因素。使用了两种独立的机器学习方法来识别关键生物标志物,包括LASSO-Cox和随机森林,两种排序方法取交集获得5个共刺激分子,用于计算共刺激分子评分(CMS)。

将BC患者分为高、低CMS亚组。生存分析显示,高CMS亚组的OS(图2C)、无转移生存期(MFS,图2A)和无进展间期(PFI,图2B)明显更好。TCGA-BRCA队列中,高CMS组预后明显更好(图2D)。在其他独立的BC队列中进行了可重复性分析,结果与Meta-BC队列相似(图2E-G)。

对所有入组的公共队列进行了荟萃分析,包括整合到Meta-BC队列的12个数据集和3个外部数据集(图3M)。基于计算的CMS,大多数队列的结果相似且显著,这表明CMS模型可以作为一种临床有用的工具,以独立预测患者预后。

(ps:机器学习算法可以用小云新开发的零代码生信分析小工具实现,云生信分析工具平台包含超多零代码分析和绘图小工具,上传数据一键出图,感兴趣的小伙伴欢迎来尝试哟,网址:http://www.biocloudservice.com/home.html

图2 CMS模型的建立与验证

  1. CMS与BC基因组改变和肿瘤免疫原性的相关性

分析BC患者的体细胞变异分布,并观察了两个CMS亚组之间不同的突变驱动模式。从BC的基因组数据中提取了四个具有不同突变活性的显性突变特征,并根据COSMIC数据库进行了注释。分析表明这四个特征与已知的COSMIC特征具有高度相似性(图3C)。提取的特征在肿瘤样本中的分布和活性如图3D所示。在低CMS亚组中,特征4的突变活性更高(图3E),特征4和1的体细胞突变数量显著高于其他标记(图3F)。将年龄、TNM分期和所有突变特征纳入了一个多变量logistic回归模型。在控制上述因素后,CMS与TMB之间的相关性仍然具有统计学意义(图3G),表明CMS对TMB的干扰作用是独立的。

CMS与其他免疫原性指标(染色体非整倍性和HRD评分)呈显著负相关,低CMS亚组具有更高水平的非整倍性和HRD评分(包括TAI、LST和LOH)(图3J和K)。这些结果表明,对共刺激分子的深入研究可能有助于阐明BC肿瘤免疫原性的异质性和免疫治疗耐药的机制。

图3 CMS与BC基因组改变和肿瘤免疫原性的相关性

  1. 高CMS患者潜在的免疫逃逸机制

GSEA描述了与细胞周期、糖酵解、MYC激活和P53信号通路相关的致癌基因集在低CMS亚组中较高(图4A)。然而,与免疫应答相关的几种途径,包括DNA错配修复、MHC II抗原呈递和程序性细胞死亡,在低CMS亚组中也被激活。同样,通过对富集的致癌通路的GSVA分析,发现CMS-low亚组显著标注了更高分数的Hippo、P53、MYC和PI3K/Akt信号通路,但与TGF-β信号通路的激活呈显著负相关(图4B)。

为了提供BC患者肿瘤内免疫状态的概述,将样本分配到不同的免疫亚型。在METABRIC队列中,只有一个样本被归类为C5(免疫沉默)亚型,而主要的免疫亚型是C1(伤口愈合),C2 (IFN-γ优势),C3(炎症)和C4(淋巴细胞耗竭)。在所有三个队列中,得分高的亚组具有明显更高比例的C3亚型(图4C),其特征是非整倍体水平和总体CNV负担较低,而得分低的患者具有更多的C2亚型,其特征是M1/M2巨噬细胞极化最高,CD8+ T含量丰富,但生存率不如C3。

大多数与基质相关的特征,如泛成纤维细胞TGF -β反应特征(Pan-F-TBRS)、上皮-间质转化(EMT)和血管生成,在所有三个队列的高CMS亚组中都显著升高,这表明高CMS患者更有可能具有免疫排斥表型,而低CMS患者更有可能具有增强的错配修复和免疫相关特征(图4D)。此外,相关分析显示,CMS与IFN-γ特征的激活呈显著负相关(图4E),而IFN-γ特征与各种癌症的促炎免疫反应呈正相关。

图4 CMS在BC发病机制和肿瘤免疫逃逸中的作用

  1. 使用CMS预测治疗

CMS在预测BC预后、免疫逃避和免疫治疗疗效方面的重要作用,作者进一步在Pan-Cancer项目中系统分析了其临床意义,探讨其作用是否可以推广到各种恶性肿瘤。对TCGA-BRCA数据集以外的所有癌症样本的CMS进行评估。关于OS和PFI的Kaplan-Meier分析证实,在包含7749个肿瘤样本的独立泛癌TCGA队列中,高CMS是一个有利的预后生物标志物(图5A和9B)。多组学数据分析显示,CMS与肿瘤免疫原性相关因素呈显著负相关,包括TMB、新抗原计数、HRD评分、CNV负担、TILs区域分数和倍性评分(图5C-H)。此外,CMS与T细胞功能障碍和TIDE评分呈正相关(图5I和5J),表明CMS可以推广为评估免疫治疗反应的泛癌症生物标志物。

比较两个CMS亚组之间各种治疗相关特征的富集分数,以检查CMS在预测治疗反应中的作用。在Meta-BC、TCGA和METABRIC队列的低CMS亚组中,大多数免疫治疗相关特征的富集分数明显更高(图5K)。进一步引入RSI来评估放射治疗的敏感性。在TCGA-BRCA和METABRIC队列中,高CMS亚组的RSI明显更高,表明这些亚群中存在潜在的辐射抗性(图5L)。

图5 使用CMS预测治疗

图片总结 图片

这项综合研究首次通过整合8000多例BC患者的大规模转录组学数据,报道了共刺激分子的潜在应用价值。建立了一个基于5种候选共刺激分子的评分系统CMS,该系统在鉴别BC患者的预后和免疫治疗反应方面表现稳定。

这篇文章的亮点就是数据量大,而且分析内容丰富,这最后还扩展到了其他肿瘤类型。整体思路比较新颖,没有做实验验证就发表了7分+纯生信,说明分析思路的创新效果也不错。

如果你还苦恼于生信分析没有思路,或者嫌分析方法太过简单、太过老套,想要创新思路的,或者热点方向感兴趣的小伙伴快来联系小云吧!

1区14分+TOP期刊不到两月接收!故事讲得好,关联中性粒细胞胞外诱捕网(NETs),助力纯生信分析高分文章!

别只盯着双硫死亡、铜死亡了!细胞死亡生信方向又上新喽,与线粒体通透性有关!现成的基因集还不快冲~

Science子刊最新研究改写发病机制?孟德尔随机化也没落后,联合GWAS搞定11分+!

Nature数据期刊8分+文章告诉你,差异基因还能这样筛选!基质和免疫评分联合多组学数据助力纯生信发文~

1个多月接收!下一个生信分析热点该不会就是它吧?—“相分离”!6分+疾病分型+预后模型的干湿结合思路!现成的基因集等你复现~