肿瘤相关生信现在竞争这么激烈,该怎么拿高分呢?2023年即将结束,现在回头看看,有没有发现9分以上的生信文章已经被“孟德尔随机化”、“临床数据库分析”、“影像组学”等新兴方向占领了大部分地盘,那要做常规生信又该从哪里突破呢?
这你可问对人了,小云所在团队做了这么多肿瘤相关生信思路设计和定制分析,很多做想继续在常规生信领域深耕的朋友都会有这个疑虑,小云还是推荐小伙伴们跟着国自然热点走,但可以适当绕过一些大家都挤破头、竞争比较大的方向(比如肿瘤免疫版块等),建议看看一些中等热度的国自然热点(比如干细胞方向)。下面就用一篇昆明理工大学唐文如教授团队新发的9分+的“干细胞”方向纯生信文章实例展示一下:
1)选题方向定位好:避开了竞争较大的肿瘤免疫版块,瞄准“干细胞”,此方向既是国自然热点方向,有热度有关注度,又与临床关联密切,但发文竞争相对小,更容易出圈发高分;
2)分析方法要创新:应用分子对接技术进行靶向药物筛选,同时进行单细胞数据分析,分子对接药物筛选在肿瘤生信分析中出现较少,新颖度加倍,在常规套路这中,分析方法的创新可以大大提高文章水平,绝对的上分神器;
整体来看,作者首先选择以“干细胞”分析方向冲击生信高地,搭载“药物筛选”和“单细胞分析”两大助推器,准确的选题+丰富的配置,简单的分析也能成功出圈拿下9分+纯生信,要复现的快来啦~另外,复现或设计思路、定制生信分析也可以扫码联系小云哦,我们可以提供最优的发文方案~
- 题目:三阴性乳腺癌干细胞特征和靶向治疗药物识别
- 杂志:Scientific Data
- 影响因子:IF=9.8
- 发表时间:2023年11月
研究背景
三阴性乳腺癌(TNBC)是乳腺癌中最具侵袭性的亚型,预后最差,其特征是缺乏孕酮、雌激素和HER2基因表达。癌症干细胞在乳腺癌的生长、转移和耐药性中起着关键作用,已有研究揭示了不同癌症中的mRNAsi相关特征,关于三阴性乳腺癌干性指数的研究却很少。本研究旨在分析癌症干细胞相关基因特征,以确定三阴性乳腺癌患者的风险分层和预后特征。
数据来源
数据集/队列 | 数据库 | 数据类型 | 样本信息 |
---|---|---|---|
TCGA-BRCA | TCGA | RNA-seq数据+临床信息 | 1217个样本,包括127个TNBC样本 |
METABRIC (Breast Cancer) | METABRIC | RNA-seq数据+临床数据 | 2509个样本,包括320个TNBC样本 |
GSE176078 | GEO | scRNA-seq数据+临床数据 | 10个TNBC样本 |
研究流程
作者首先基于TCGA-BRCA队列中的127个TNBC样本使用一类逻辑回归(OCLR)机器学习算法计算TNBC患者的干细胞指数(mRNAsi),利用ESTIMATE算法计算免疫评分并分析了免疫浸润和mRNAsi之间的关系。然后,筛选高和低mRNAsi组间的DEGs,并进行功能富集分析。随后基于这些DEGs进行一致性聚类将TNBC患者分为两个干性亚型,同时通过Cox和LASSO回归分析建立了一个基于16个基因的预后模型,并在外部验证队列中验证其预测性能。基于单细胞数据集探索了肿瘤免疫微环境,并分析了16种基因在不同细胞类型中的表达。使用HPA数据库进一步验证了预后基因的表达水平。最后,对16个基因进行了分子对接研究,以筛选抗干性化合物。
图1 分析流程图
主要结果
1. mRNAsi与肿瘤微环境的相关性、差异性和功能富集性分析
作者首先使用OCLR和ESTIMATE算法计算了127例三阴性乳腺癌患者的干细胞指数和免疫评分,并对患者进行排序以研究mRNAsi和临床特征之间的关系(图2A, B)。为了探索mRNAsi与免疫浸润的相关性,作者分别利用ssGSEA方法、ESTIMATE和CIBERSORT算法分析了免疫浸润,结果显示,低mRNAsi组的免疫活性高于高mRNAsi组(图3a),mRNAsi与免疫评分、间质评分和ESTIMATE评分显著负相关(图3b-d),mRNAsi与滤泡辅助T细胞、CD4记忆激活T细胞和M1巨噬细胞显著正相关(图3e)。由于按mRNAsi中值分组的样本之间没有显著差异,作者又基于“survminer”分析的结果将127名TNBC患者重新分类为高或低mRNAsi组,并从两组间筛选得到2228个DEGs(图3g),针对DEGs还进行了功能富集分析(图3i)。最后利用KM曲线评估两组间的预后差异,显示mRNAsi评分高的患者总体生存状况较差(图3j)。
图2 mRNAsi和免疫评分的计算
图3 mRNAsi与肿瘤微环境的相关性、差异性和功能富集性分析
2. TNBC干性亚型的鉴定
作者根据2228个DEGs表达水平进行了一致性聚类分析,将127名三阴性乳腺癌患者分为两个干性亚型,包括I型(67例,53.7%)和II型(60例,47.2%)(图4a)。利用ESTIMATE和CIBERSORT算法来阐明两种不同干细胞亚型的不同免疫浸润,结果显示,亚型I的间质评分、免疫评分和评估评分均低于亚型II(图4c-e),免疫浸润包括B细胞、CD4+细胞亚群、单核细胞和肥大细胞在干性亚型II中明显更丰富(图4i)。以上结果表明,亚型I比亚型II更具免疫原性,亚型I的患者可能对免疫疗法表现出更好的反应。
图4 TNBC干性亚型的鉴定
3. 干性相关预后模型的建立和评估
作者首先使用METABERIC和TCGA-BRCA合并数据集,提取447个三阴性乳腺癌样本,分成训练和测试集。基于2228 DEGs进行Cox回归和Lasso回归分析,获得16个预后基因,以构建预后风险模型(图5a)。随后计算了每个患者的风险评分,并将他们分为低风险组或高风险组,进行KM生存分析和预后性能评估,显示在训练和测试队列中低风险组的预后均明显好于高风险组(图5b,d),ROC曲线显示模型可以准确地预测TNBC患者的预后(图5c,e)。
图5 预后模型的建立和评估
4. 预后基因的小分子化合物分子对接分析
作者通过CTD数据库、PubChem数据库和Uniport数据库筛选与16个预后基因相关的靶向药物,然后使用Autodock进行分子对接,以研究与预后基因相互作用的小分子化合物,最后筛选出了10个有利于改善由16个基因引起的预后不良的小分子化合物,为三阴性乳腺癌的靶向治疗提供了新的研究思路(图6)。
图6 靶向药物筛选
基于单细胞数据集GSE176078,总共注释得到21种不同类型的细胞群(图7a)。观察了21种不同免疫细胞中16种基因的表达差异(图7c),显示BMP4在上皮细胞和成纤维细胞中高表达,CCBE1在间质细胞中高表达。
图7 预后基因的单细胞分析
文章小结
这篇文章思路很清晰分析很简单,依靠“干细胞”国自然热点选题,辅以药物筛选、单细胞分析的创新分析方法,成功拿下9分+纯生信!思路超级容易复现,性价比还高,常规生信想发高分的可以学起来了,换个癌种或者再换个小众方向就能复现,高分文章在向你招手啦!另外,想要复现/设计思路或定制生信分析的朋友欢迎扫码联系小云,风里雨里一直在等你~