原文转自:一起实验网
对于该方法和思路适用于其他疾病。
更多思路获取请戳https://www.yiqishengxin.com/
早!今天小编和大家分享一篇2022年1月发表在Comput Biol Med杂志(一区,IF=6.698)的文章。随着单细胞测序的成本降低,只有转录组的生信分析又太单调,为什么不试试单细胞 转录组呢?目前单细胞 转录组已经不少了,但再加一个免疫细胞方向,是不是文章更上档次和与众不同了。在这篇文章中,作者先将单细胞数据集进行分析得到肺癌中T cell簇,进而分析T cell和其他细胞簇的相互作用及T cell的时间轨迹。将T cell的标志基因与转录组中的差异表达基因取交集得到差异表达的T cell 免疫相关基因,并基于他们构建了肺癌新的预后模型。根据这篇文献思路,我们可以在单细胞数据分析在不同疾病中的重要免疫细胞,从细胞水平和基因层面探究新的预后模型或生物标志物。
背景和方法
肺癌在全球范围内呈上升趋势,是癌症死亡的主要原因。近几十年来,越来越多的研究使用RNA-seq数据探索了肺癌的潜在预后标志物,并提高了我们对肿瘤发生和进展的理解,但这些预后特征是基于RNA-seq数据,它无法检测肿瘤样本中确切的细胞和分子变化。单细胞RNA测序(scRNA-seq)能够在单细胞水平上测量基因表达,并揭示单个细胞或同源细胞类型中基因表达的异质性。
方法
1. 肺癌的scRNA-seq数据集来自之前的研究-Single-cell RNA sequencing reveals distinct tumor microenvironmental patterns in lung adenocarcinoma。从TCGA数据库下载肺癌的RNA-seq数据和临床病理学特征。此外,GSE68465从GEO数据库下载。
2. 处理并分析单细胞数据来鉴定各类细胞簇,降T cell的标志基因进行功能富集分析,及T cell与其他细胞簇的相互通讯的强度和次数和T cell的伪时间序列分析。
3. 利用TCGA-LUAD的RNA-seq数据得到DEGs,与T cell的标志基因取交集。基于交集基因构建了肺癌的预后模型。
4. 利用ESTIMATER和CIBERSORT工具分析了预后模型与肺癌的肿瘤微环境的关系。
研究结果1.肺腺癌的细胞构成
通过分析单细胞数据得到了25个细胞簇(图1A-1C)。随后通过标记基因鉴定出9种细胞类型(图1D)。图1E显示了9种细胞类型中前2名标志基因表达的特征图(图1E)。图1F显示了9种细胞类型的top1标志基因表达水平。
图2A显示了9种细胞类型的前5名标记基因的热图。图2B显示了CD4 T细胞中高表达的CD4、SELL、CCR7、ITK和CD8 T细胞中的高表达CD8A,CD8B,CD27,CRTAM。随后,作者再次对T cell簇进行了亚聚类和注释,T cell被分为12个亚组(图2C),CD4 T细胞和CD8 T细胞的细胞簇如图2D所示。后续作者又分析了两个细胞簇中标记基因的表达水平(图2E-2F)。
2.与scRNA-seq中T细胞相关的富集分析
作者将T cell内的标志基因进行了功能富集分析,富集的条目均于T cell相关(图3A-3B)。此外,还根据特定的信号通路和配体-受体相互作用推断了细胞-细胞通信网络,发现TNF-TNFRSF1B在TNF信号通路通信网络中起着至关重要的作用(图3C-3F)。
3.与scRNA-seq中T细胞相关的转录因子调控网络
SCENIC的分析预测了T细胞中转录因子的关键调控网络。RUNX3,GATA3,IRF4,TBX21和EOMES(五个核心TF)将成为控制LUAD-Tcell的核心枢纽(图4A-4B)。利用Cytoscape可视化预测的TFs及其靶基因,构建基因调控网络(图4C)。
4.LUAD病变中T细胞成熟的轨迹
使用Monocle软件进行了伪时间序列分析,结果表明,4个簇大致可分为5种分化状态(图5A-5B,5D),图5C是细胞分化的时间轴,颜色越深,发育阶段越早。结果表明:簇0,1的细胞处于发育早期,簇3处于发育的末期。使用BEAM来寻找以分支依赖性方式调节的基因。热图显示了两个谱系在同一时间点的变化。图5E和5F显示了当分支1和分支2中的细胞分别执行不同的基因表达程序时差异表达基因的变化。图5E表示分支1的差异表达基因变化。这些基因分为四类,分别与磷脂外排、体液免疫应答、蛋白质折叠和伴侣结合等相关。图5F显示了分支2的差异表达基因变化。这些基因被分为四类,分别是肌动蛋白丝组织、细胞质翻译、蛋白质折叠、体液免疫应答等。这两个分支点都与体液免疫反应、对细菌的防御反应和蛋白质折叠有关。
5.预后模型构建与验证
利用TCGA-LUAD的RNA-seq数据得到821个DEGs,与T cell的标志基因取交集。基于交集基因使用单因素Cox LASSO 多因素Cox构建了肺癌的预后模型。通过LASSO鉴定了49个基因(图6A-6B)。多因素Cox得到9个预后相关基因(ASZ1、CCDC85B、CCL20、MAPK1IPL1、MYO6、RHOQ、ST13、TLE1和TMEM11)。基于9个预后基因的系数,计算风险评分中值将所有患者分为高风险组和低风险组(图6C)。生存曲线显示,与低风险组患者相比,高危组患者的OS更差(图6E)。此外,它还显示,在预测TCGA队列中这些个体的OS方面,风险评分具有良好的表现(1年,3年和5年OS的AUC:0.800,0.753和0.691)(图6F)。此外,在GSE68465队列中观察到类似的结果(图6G-6I)。
将模型结果将代入单细胞数据。图7A的点图显示了单细胞数据中九个预后基因的表达。图7B的散点图显示了具有伪时间值的9个预后基因的动态表达。
6.高危和低危人群之间的临床相关性、富集分析
通过单因素Cox 多因素Cox筛选了风险评分作为肺癌患者的独立预后因素(图8A-8B)。在多因素Cox中发现显著的变量被输入到列线图中。最后,年龄、性别、分期、T、N、M和风险评分被纳入列线图(图8D)。然后,将每个变量的分数组合成一个总分,预测3年和5年后OS 的概率(图8E-8F)。校准曲线显示,列线图预测与实际观测结果在3年和5年的生存概率中具有令人满意的一致性。此外,进行了GSEA分析,以确定两组之间最显着的富集途径。发现高危组的基因在亚油酸代谢、肠道免疫网络IgA产生和药物代谢细胞色素P450中显着富集(图8G)。然而,低风险组的基因在剪接体、癌症通路和细胞周期中显着富集。高危组和低危组的TIDEE评分存在差异。低危组TIDEE评分较高,低危组患者免疫治疗效果较差,高危组患者免疫治疗效果可能更好(图8C)。
7.LUAD与免疫细胞浸润和免疫检查点的相关性
低危组肺癌组织的免疫评分、基质评分和总体ESTIMATE评分较高,表明低危组肺腺癌肿瘤的比例较低(图9A)。使用P<0.05的CIBERSORT工具,共筛选了22个肿瘤浸润免疫细胞(图9B)。结果显示,CD4记忆激活T细胞、调节性T细胞(Tregs)和巨噬细胞M0在高危组中表达较高(P < 0.05),而单核细胞、静息树突状细胞和静息肥大细胞在低危组中表达较高。此外,我们分析了高风险或低风险组中免疫检查点的差异(图9C)。TNFSF9、TNFSF4、TNFRSF9、TNFRSF4、PVR、PDCD1、LDHB、LDHA、LAMA3和IL23A在高危组中表达较高(P < 0.05),而TNFSF18、PTPRC、IL12B、CD80、CD40LG、CD28在低危组中表达较高。最后,进一步评价免疫浸润和免疫检查点对肺癌患者临床预后的影响。结果显示,低危组单核细胞在生存时间方面与肺癌患者预后不良有关(图9B)。CD40LG、CD80、IL12B和PTPRC低危组与LUAD患者生存时间预后不良有关,IL23A、LDHA、LDHB、PVR高危组与有生存时间的LUAD患者预后不良有关(图9C)。这些结果表明,肿瘤浸润免疫细胞可能在肺癌的临床过程中发挥重要作用。
,