The Cancer Gene Census (CSC) 是 COSMIC 中的一项重要资源,有专家策划对所有驱动人类癌症的基因进行描述和分类,用作基础研究,临床报告以及制药产业中癌症遗传学的标准。CGC 起始于2004年,目前囊括了719(2018 v86)个基因,详细记录了这些基因是如何导致肿瘤的。本篇综述将介绍怎么界定将一个基因囊括进 CGC,以及如何根据其属性将其进行分类以便更好地描绘其在肿瘤发生中的作用。此外,还将对 CGC 新的架构进行描述。
定义癌症基因
癌变过程中,细胞内调控网络受到干扰,使得细胞重编程,最终驱动不受控制的细胞增殖以及对组织环境的适应。许多细胞进程能够被干扰,从而导致癌变,其中,体细胞和生殖系突变是最主要的原因。了解哪些突变会影响基因的功能,以及会产生什么样的后果能帮助我们构建导致瘤发生的机制和功能因果链,从而设计针对性的疗法
驱动突变通常会导致三种后果:功能失调(dysfunction),通常是因为蛋白结构的变化;调节失常(dysregulation),控制基因表达的调节信号改变所致;以及完全废除(abrogation),抑癌基因缺失。因此,为了理解变异对疾病进程的影响,必须先确定有哪些基因,其功能改变后会驱动或者抑制肿瘤的发生,而 CSC 的目的正在于此
每个基因将会根据其体细胞突变特征以及其在致癌过程中的作用被分为 oncogene,tumor supressor gene (TSG) 以及 fusion gene 三类。如果一个基因被划分会致癌基因,要求有证据表明该基因产物能够驱动肿瘤,以及肿瘤样本中的突变会导致功能获得;如果一个基因被确定为抑癌基因,则要求野生型的基因产物具有肿瘤抑制功能,而肿瘤中该基因的突变会导致功能丧失;对于融合基因,由于其通常是由两个不同基因因基因组结构重排导致产生新的嵌合基因,CGC 会描述融合事件是如何影响原来的基因以及各部分对融合基因的贡献。基因融合的结果有时候能够使得原基因被划分为具有抑癌或者致癌作用,从而在 CGC 中对应性地归类;但有时候也可能某一基因仅为次要的遗传元件,只起到调节或者结构域的作用,单靠其本身并不具有抑癌或者致癌作用,也就无法单独划归为致癌或者抑癌基因,所以有了第三类的融合基因
构建更广阔的视野
CGC 包含两层结构,囊括在哪一层取决于支持证据的强度以及基因在癌变过程中的作用
对于 Tier 1,要求基因必须具有与癌症相关的文献记录,具有可重复性,且有证据表明癌症中的突变能够改变基因产物活性,驱动癌变。要注意的是虽然 COSMIC 仅包含癌症样本和细胞系中的体细胞突变,但是 CGC 也会使用来自生殖系突变的信息。TSGs 通常具有广泛的失活突变,而显性的原癌基因则是带有错义或者插入缺失突变热点区域,对于融合基因,则要求基因能够驱动癌变,至于构成融合基因的原基因,可以是调控元件,如启动子,增强子或者二聚体结构域
Tier 2是 CGC 新的部分,描述了最近确定的在癌症中发挥作用的基因,以及有强烈标志表明在癌症中起作用,但缺少有力机制或者功能证据的基因。Tier 2中的基因同样具有抑癌或原癌基因典型的突变模式,但是相关的文献证据较少,或者有文献证据证明其在癌症中的作用,但是突变模式还不清楚,以及通过表观修饰手段导致功能失调