癌症以突变和细胞基因组的其他改变导致细胞生长失控为特征。一个肿瘤可以有成百上千种突变,但只有少数突变对其致癌能力至关重要。这些关键突变会影响癌症驱动基因的功能。找到隐藏这种癌症驱动突变的基因是癌症研究的主要目标之一,也是开发更有效的癌症检测和治疗方法的关键。
8月10日,巴塞罗那生物医学研究所等机构的科学家们发表在Nature Reviews Cancer上的研究结果提供了迄今为止最完整的癌症驱动基因汇编图谱。他们鉴定出了568个癌症驱动基因,并指出了它们的肿瘤发生机制。这项研究对整合癌症基因组(integrative OncoGenomics, IntOGen)平台数据进行了重大更新。将这项研究方法应用于不断增长的体细胞肿瘤突变数据集,将有助于我们不断完善对癌症遗传基础的认识。
图片来源:Nature Reviews Cancer
具体来说,研究人员对66种不同类型癌症221个队列共28 076个样本的数据进行了分析。其中大多数样本都是由大量测序工作所贡献的,例如International Cancer Genome Consortium (ICGC, 3 988个样本) 、The Cancer Genome Atlas (TCGA, 10 010个样本) 、Pan-Cancer Analysis of Whole Genomes (PCAWG, 2 554个样本) 、Therapeutically Applicable Research to Generate Effective Treatments (TARGET, 246个样本)。
图片来源:Nature Reviews Cancer
IntOGen平台在肿瘤突变数据集中的应用。从公共领域收集的肿瘤突变数据集,用于构建当前的驱动基因汇编图谱。两个圆环图分别表示按来源(左)或癌症类型(右)分类的所有数据集。在这两个图中,最里面的环表示来自原发性/转移性/复发性肿瘤的队列,而第二个环则突出显示成人或儿科肿瘤的队列。
癌症驱动基因在调节细胞生长、细胞周期和DNA复制上扮演着关键的角色,这些基因发生突变(尤其是介导恶性细胞快速增殖和扩散的突变)后,癌细胞就能躲避宿主免疫系统和其它防御系统,并快速扩散、侵入其它组织,同时这些癌细胞还会改变环境以利于自身发展。
这项系统性的汇编工作不仅增加了我们对熟知癌症基因作用的认识,而且指出了152个潜在的新驱动基因,即未在Cancer Gene Census(CGC,尽管不完整,但据作者所知是来自文献的最全面最准确的已验证癌症基因集)中注释的基因(下图a)。
突变驱动基因汇编图谱(图片来源:Nature Reviews Cancer)
其中,上图c底部未被CGC注释的5个基因已经被独立的研究证明与肿瘤的发生有关:
Krueppel-like factor 5(KLF5)编码一种参与人类发育调控的转录因子,被鉴定为癌症驱动基因。经不同机制改变后,在宫颈鳞状细胞癌、膀胱癌和肺鳞状上皮细胞癌中表现出正向选择信号。
Bromodomain-containing 7(BRD7)的几个旁系同源物在CGC中已经被注释,并且在推动黑色素瘤和肝癌的发生过程中被假定为SMAD转录因子的共同激活剂。
RAS GTP酶激活蛋白1(RASA1)在人类支气管上皮细胞和黑色素瘤细胞系中表达减少或功能失调突变可增加RAS介导的信号传导。它也与三阴性乳腺癌的促肿瘤功能有关。因为RASA1编码的蛋白质和神经纤维蛋白1(NF1)编码的蛋白质一样,负调控RAS-MAPK通路,因此这两个基因都被认为是肿瘤抑制因子,它们的突变模式也表明了这一点。
赖氨酸特异性去甲基化酶3B(KDM3B)已被证明(1)参与肝细胞癌的细胞周期调控;(2)在结直肠癌干细胞中作为WNT信号通路的激活剂发挥作用。尽管这两项研究表明KDM3B在肿瘤发生过程中起着致癌基因的作用,但另一份报告指出,它的一些种系突变会导致对Wilms肿瘤的易感性。因此,KDM3B在肿瘤发生中的确切作用方式仍有待确定。
编码叉头框(forkhead box, FOX)转录因子的几个基因在CGC中被注释为几种恶性肿瘤的驱动因子(例如,乳腺癌和前列腺癌的FOXA1以及神经母细胞瘤的FOXR1)。在子宫癌中经常发现的FOXA2突变倾向于影响DNA结合域或导致蛋白质产物截断,使其无法定位到细胞核。这些突变形式中的一些已知会导致CDH1基因(编码E-cadherin)的表达减少,因此在某些肿瘤进展过程中与上皮细胞向间充质细胞的转化有关。
此外,通过对568个癌症驱动基因的鉴定,研究人员发现它们中大多数是高度特异性的,其突变仅能引发少数几种肿瘤。然而,也有不到2%(10个)的基因作用广泛,它们可以导致20种以上不同类型的癌症(下图)。
图片来源:Nature Reviews Cancer
领导这项研究的Nuria Lopez-Bigas表示:“揭示这些癌症驱动基因为癌症研究人员提供了重要的知识,对临床决策有重要影响。举例来说,如果研究人员知道肿瘤发生的能力依赖于特定的蛋白,那么就可以利用批准的靶向性疗法来治疗癌症患者,比如使用抗体和其它抑制癌细胞增殖功能的抑制剂。”
值得一提的是,该研究的汇编数据及处理系统可在intOGen平台 (https://www.intogen.org/search) 访问。研究人员表示,他们将继续收集肿瘤测序数据,制作更全面的汇编图谱,读者可以在intOGen网站上查看更新内容。
最后,附上568个癌症驱动基因列表:
数据来源:intOGen
参考资料:
1# integrative OncoGenomics (intOGen) platform. https://www.intogen.org/search#release-table
2# Francisco Martínez-Jiménez et al. A compendium of mutational cancer driver genes. Nature reviews cancer(2020)
3# 568 genes identified with the potential to trigger cancer (来源:Medical press)
,