当前位置: 首页 > 癌症基因组 > 正文

癌症基因组学研究全程回顾(3)

F1.large

这是《癌症基因组研究全程回顾》系列文章的最后一篇:有关RNA和表观修饰对癌症发生发展的影响。

RNA编辑

在我们人体中,DNA和RNA序列之间的差异也被称之为RNA编辑,这是一种广泛存在的现象。最频繁的RNA编辑类型是通过腺苷脱氨酶作用于RNA(ADAR)从而实现由腺苷到肌苷的转换。然后紧接着,剪接和翻译机制会将肌识别为鸟苷。在一些肿瘤基因组比正常基因组有着更更比例的RNA-DNA差异。

Jiang Q., Crews L. A., Barrett C. L., Chun H. J., Court A. C., et al. (2013) ADAR1 promotes malignant progenitor reprogramming in chronic myeloid leukemia. Proc Natl Acad Sci U S A 110: 1041-1046

作者发现,慢性髓细胞白血病(CML)急变期的祖细胞有着更高的IFN-r通路基因表达以及BCR-ABL扩增。在CML发展期间,他们还发现IFN应答的ADAR1 p150亚型的表达增强,并且腺苷-肌苷的RNA编辑增加。

MicroRNA和非编码RNA

MicroRNA(miRNA)的长度很短,大小集中在17bp-25bp之间,属于非编码RNA(ncRNA)家族的成员。它们调控多种不同的生物学功能,包括发育、细胞增殖、细胞分化、信号转导、凋亡、代谢和细胞寿命。

通过RNA-诱导沉默复合物(RISC)与转录本的3-UTR或者与编码区中的识别位点相互作用。miRNA的一个主要作用是抑制基因的转录后表达。在多种癌症中,许多miRNA位于存在序列缺失删除或扩增的基因组区域,这表明它们很可能在癌症的发展过程中扮演很重要的角色。miRNA的编辑位点已经在近年来的研究中被发现了,表明RNA编辑和miRNA介导的调控之间可能存在着关联。同时由于miRNA的测定简单、相对稳定,并且在大量mRNA的控制上起作用,这就让miRNA成为癌症诊断以及治疗期间的检测和分期过程中极具吸引力的标志物。

Law P. T., Qin H., Ching A. K., Lai K. P., Co N. N., et al. (2013) Deep sequencing of small RNA transcriptome reveals novel non-coding RNAs in hepatocellular carcinoma. J Hepatol

这篇文章描述了一种新的PIWI-互作RNA(piRNA)piR-Hep1,它参与了肝脏肿瘤发展。与周围正常肝脏相比,46.6%的肝癌细胞(HCC)存在piR-Hep1表达上调。piR-Hep1的沉默抑制了细胞活力、运动和侵袭。作者还发现miR-1323在HCC中的大量表达,以及它与肝硬化背景下所产生的肿瘤的独特关联。

实验设计上的注意事项

测序深度与检测灵敏度是直接相关的。在典型的实验中,如果测序流动槽(Flowcell)的一条通道(lane)只上一个样本,那么测序深度会非常高,这能实现极其灵敏的检测。基于此原因,miRNA的测序深度很少成为考虑因素。在筛查应用中,或不需要如此高深度检测的研究中,样品可加上测序Index标签,从而能够在同一个测序lane中上样多个不同的样本。需要注意的是,在设计miRNA的测序深度时,要时刻记住miRNA控制基因表达,因而miRNA水平的小变化可能影响许多编码蛋白。

新发现的miRNA应当通过功能分析(如Ago2结合或敲除实验)来确认。

实验应当包含足够的样品,以便结论具有真正的统计意义和高的可信度。一般来说,建立一个可能的假设相对来说是比较容易的,只要能证明miRNA存在于患者的肿瘤中,即便样本数量不多也是足够的。但是要真正验证假设就没那么容易了,通常需要大量的患者来检验,并建立统计学可信度。目前,关于如何在测序研究中建立统计学可信度和多重检验纠正,还没有特别公认的方法。当前基于测序的miRNA分析并没有实现miRNA表达的绝对定量,而仅是不同miRNA(如肿瘤-正常配对)的相对量。

样品分层是癌症样品的一个问题。一个特定的癌症表型可能代表几种不同的病因和机理。为了要进行严格的分析,应当有足够多的样品量,从而能够充分代表每个肿瘤亚型。而miRNA的表达会随着肿瘤的发展而变化,因此在实验设计时应建立肿瘤分期和分级。

RNA-蛋白结合(CLIP-Seq)

在人类细胞中,大多数mRNA(或前体mRNA)与核不均一性核糖蛋白(hnRNP)相结合,形成大的hnRNP-RNA复合物。hnRNA蛋白在RNA加工的所有关键环节中都发挥重要作用,包括前体mRNA剪接以及mRNA出核、定位、翻译和稳定性。几十种RNA结合蛋白(RBP)和基因的hnRNP蛋白与癌症相关联。

RNA-蛋白的相互作用可通过交联免疫沉淀测序(CLIP-Seq)来测定。在CLIP-Seq中,细胞经过紫外线处理,让RBP与RNA复合物共价交联。细胞随后被裂解,RBP-RNA复合物被免疫共沉淀,从而测序相应的RNA。

Wilbert M. L., Huelga S. C., Kapeli K., Stark T. J., Liang T. Y., et al. LIN28 binds messenger RNAs at GGAGA motifs and regulates splicing factor abundance. Mol Cell 48: 195-206

LIN28是个保守的RNA结合蛋白,它与多能性、重编程和肿瘤的形成相关。在各种不同的癌细胞和原发肿瘤组织中都发现LIN28的异常上调。在这篇文章中,作者利用CLIP-Seq鉴定了大约四分之一分布于人类转录本中LIN28的结合位点。从这些结合位点中他们发现,LIN28与mRNA中富含环结构的GGAGA序列结合。同时还发现了,LIN28的表达能够导致可变剪切中的下游变化。

表观遗传和甲基化

癌症发展过程中的表观遗传改变与异常的基因表达相关联。近期的研究证据表明,表观遗传上的改变可能在癌症 **起始中** 发挥作用。表观遗传的控制是通过多个不同过程进行介导的,包括DNA修饰(甲基化或乙酰化)、组蛋白修饰和核小体重塑。发现控制表观基因组的基因发生突变,在人类癌症中是一个相当普遍的现象。NGS测序技术提供了一整套工具,可定位突变并测定它们对癌症发展的影响。

癌症中表观遗传修饰物的基因突变。在不同类型的癌症中经常观察到三类表观遗传修饰物发生突变,这突出了遗传学和表观遗传学之间的串扰。表观遗传修饰物的突变有可能引起癌症的全基因组表观遗传改变。了解遗传和表观遗传变化的关系将为癌症治疗提供新的见解。

DNA修饰

DNA修饰目前可以很容易地通过多种技术来进行测定。不同技术的选择取决于所需的通量和分辨率。

Bert S. A., Robinson M. D., Strbenac D., Statham A. L., Song J. Z., et al. Regional activation of the cancer genome by long-range epigenetic remodeling. Cancer Cell 23: 9-22

文章作者通过协同的长距离表观遗传激活(LREA)技术,鉴定出一种结构域基因去调控的机制。这些区域通常会跨越1Mb的基因组长度,包括关键癌基因、microRNA和癌症的生物标志物基因。LREA结构域中基因启动子的特点是活性染色体标记的的获得和抑制标记的丢失。

Brastianos P. K., Horowitz P. M., Santagata S., Jones R. T., McKenna A., et al. Genomic sequencing of meningiomas identifies oncogenic SMO and AKT1 mutations. Nat Genet 45: 285-289

为了鉴定和验证脑膜瘤中的体细胞遗传改变,作者对17个脑膜瘤进行了全基因组或外显子组测序,并对另外48个肿瘤进行了靶向测序。他们所观察到的突变谱是分布广泛,但他们证实了43%的肿瘤中存在病灶NF2失活,并在另外8%的肿瘤中发现表观遗传修饰物的改变。

Duncan C. G., Barwick B. G., Jin G., Rago C., Kapoor-Vazirani P., et al. A heterozygous IDH1R132H/WT mutation induces genome-wide alterations in DNA methylation. Genome Res 22: 2339-2355

脑胶质瘤、急性骨髓性白血病和软骨瘤中经常发生NADP+依赖的异柠檬酸脱氢酶IDH1和IDH2的单等位点基因点突变。作者表明,IDH1R132H等位基因的杂合表达足以诱导这些肿瘤特有的以DNA甲基化为特征的全基因组改变。这说明了IDH1R132H/WT突变体是推动人类癌细胞的表观遗传不稳定性的原因。

Zhang J., Benavente C. A., McEvoy J., Flores-Otero J., Ding L., et al. A novel retinoblastoma therapy from genomic and epigenetic analyses. Nature 481: 329-334

视网膜母细胞瘤是一种发生于视网膜的侵袭性儿童癌症,由RB1失活所引发,但潜在机理仍然未知。在此类高度侵袭性的癌症中,许多基因都参与其中,但RB1是唯一的已知发生突变的癌基因。与有限的体细胞突变不同,相对正常的成视网膜细胞,肿瘤的甲基化图谱表现出巨大的改变。最惊人的结果之一是人视网膜母细胞瘤中原癌基因脾络氨酸激酶(SYK)的诱导表达。SYK是肿瘤细胞生存所必需的。研究人员接着表明,小分子抑制剂对SYK的抑制导致培养和体内的视网膜母细胞瘤的细胞死亡。

实验设计上的注意事项

每种组织和细胞类型都有着独特的甲基化模式;因此必须获得感兴趣的组织以便分析。癌症研究中,肿瘤组织-癌旁正常组织的配对可简化分析。

通过重亚硝酸氢盐测序所产生的超大量CpG标志物很难解释,且可靠的统计学分析目前仍然困难重重。不过,下面一些实际的方法可简化分析:

  • RRBS-Seq通过限制覆盖度而简化分析;
  • 综合分析大大改善了结果的可解释性。例如,将表达分析与甲基化分析相结合,让我们可专注于表达水平改变的基因;
  • 将分析限制在某个感兴趣的基因或区域中。这种方法对GWAS的后续研究很有效,也适合已有实验证据说明目的区域存在基因调控或染色质重塑的研究。与降低代表性的方法不同。这种方法实现了更多区域的分析,因此可获得更多信息。

组织培养物应当谨慎使用。随着时间的推移和组织增殖,培养物的甲基化水平可能已经改变,不大能代表原先的组织样本。

组蛋白修饰

组蛋白修饰通常指的是甲基化和乙酰化。组蛋白H3K9、H3K27和H4K20的甲基化与基因转录的抑制相关,而H3K4和H3K36的三甲基化与活性转录的染色质相关。组蛋白乙酰化几乎总是与染色质可接近性和转录活性水平的增高相关。通过操控染色质状态和DNA可接近性,表观遗传修饰在各个发育阶段、组织类型和疾病中都对基因表达的控制起着关键作用。

Wilkinson A. C., Ballabio E., Geng H., North P., Tapia M., et al. (2013) RUNX1 is a key target in t(4;11) leukemias that contributes to gene activation through an AF4-MLL complex interaction. Cell Rep 3: 116-127

这篇文章报道了一种转化机制,其中两个致癌融合蛋白合作激活目的基因,然后调节其下游产物的功能。

实验设计上的注意事项

每种组织和细胞类型都有着独特的甲基化模式;因此必须获得目的组织以便分析。

组蛋白修饰可以通过各种ChIP-Seq方法进行检测,原理是通过抗体与目标甲基化组蛋白进行特异结合。

同样,组织培养物应当谨慎使用。随着时间的推移和组织增殖,培养物的甲基化水平可能已经改变,不大能代表原先的组织样本。

染色质结构与重排

染色体重排需要DNA双链断裂的形成和连接。这些事件的发生,会破坏基因组的完整性,并经常在白血病、淋巴瘤和肉瘤中观察到。并且特定基因间的反复的基因融合在不同的个体中均观察到,这表明这些基因一定在细胞周期中的某个阶段他们之间的物理位置非常接近。

这是一个设想的三维、具有转录活性的复合物,它包含了致密的环化位置。这个示意图是基于检测到的成环事件,并假设所有成环事件都能发生在单个细胞内。在这个模型中,所有小环汇集到一个共同的核心(蓝色球)。环降低了转录活性复合物的物理大小,从而推动转录因子接近待定的基因组位点。

检测染色质相互作用。在三维空间中,相同或不同染色体上远端的基因组区域相互作用,而这种相互作用是由一个或多个DNA结合蛋白介导的。a) *ChIP-Seq* 利用染色质免疫共沉淀来鉴定DNA和蛋白的相互作用。人们采用各种DNA-片段化方法和核酸外切酶,来缩小片段的大小分布。b)染色质构像捕获实验利用一个连接步骤将互作的染色质片段相连接。这种方法可鉴定与遥远序列相结合的蛋白。c)配对末端标签测序分析染色质相互作用(ChIA-PET)同样也利用连接步骤来检测染色质相互作用,将不相邻的互作区域配对。然而,ChIA-PET利用染色质免疫共沉淀(ChIP)步骤,只能鉴定特定蛋白的相互作用,如RNA聚合酶II。

参考文献

Papantonis A., Kohro T., Baboo S., Larkin J. D., Deng B., et al. TNFalpha signals through specialized factories where responsive coding and miRNA genes are transcribed. EMBO J 31: 4404- 4414

作者利用测序以及染色体构像捕获(3C)和ChIA-PET表明,TNF_alpha诱导响应基因聚集在分散的『NF-B工厂』。一些『工厂』还专门转录编码miRNA的响应基因,这些miRNA靶定下调的mRNA。

Rocha P. P., Micsinai M., Kim J. R., Hewitt S. L., Souza P. P., et al. Close proximity to Igh is a contributing factor to AID-mediated translocations. Mol Cell 47: 873-885

细胞核组织可决定『脱靶』活性以及融合伴侣的选择。这项研究表明,绝大多数已知的活化诱导胞嘧啶核苷脱氨酶(AID)介导的Igh转位伴侣在类型转换过程中与此位点接触的染色体结构中被发现。此外,这些相互作用结构域可用来鉴定被AID靶定的其他基因。

Theodoratou E., Montazeri Z., Hawken S., Allum G. C., Gong J., et al. Systematic meta- analyses and field synopsis of genetic association studies in colorectal cancer. J Natl Cancer Inst 104: 1433-1457

这篇研究文章表明,T细胞特异的转录因子GATA3在介导增强子接近调控区域上扮演了重要角色,这些调控区域参与了雌激素受体(ESR1)介导的转录。GATA3沉默导致在雌激素刺激之前辅助因子和活性组蛋白标记的整体重新分配。

Hakim O., Resch W., Yamane A., Klein I., Kieffer-Kwon K. R., et al. (2012) DNA damage defines sites of recurrent chromosomal translocations in B lymphocytes. Nature 484: 69-74

作者发现,在培养的小鼠B淋巴细胞中,缺乏经常性的DNA损伤时,Igh或Myc与其他所有基因之间的易位与它们的接触频率直接相关。反过来,与经常性位点指向的DNA损伤相关的易位与DNA断裂形成的速率成正比。他们认为,非定向重排反映了细胞核结构,而DNA断裂形成决定了包括驱动B细胞恶性肿瘤在内的经常性易位的位置和频率。

综合分析(多组学分析)

所有的生物过程都是相互关联的,而在癌细胞发生过程的任何一个变化都会影响其他所有过程。突变可能影响所表达的活性,继而又影响DNA甲基化,再就影响其他许多基因的表达等等一连串的反应。每个个体都有着大量的特有突变,再加上这一连串的事件,能够让人们深入研究各种用于区分癌症的疾病表型。综合分析可以使揭示癌症生物学的真正复杂性向前迈进了一步。研究人员如今能够检测大部分的单个过程,但认识和治疗癌症的真正进步将来自于对所有这些过程的综合分析,也就是常说的多组学分析。

参考文献

Weischenfeldt J., Simon R., Feuerbach L., Schlangen K., Weichenhan D., et al. Integrative genomic analyses reveal an androgen-driven somatic alteration landscape in early-onset prostate cancer. Cancer Cell 23: 159-170

作者发现,早发性前列腺癌的形成涉及到雄激素驱动的结构重排。相比之下,老年发病的前列腺癌积累了非雄激素相关的结构重排,表明一种不同的肿瘤形成机制。

Cowper-Sal lari R., Zhang X., Wright J. B., Bailey S. D., Cole M. D., et al. Breast cancer risk- associated SNPs modulate the affinity of chromatin for FOXA1 and alter gene expression. Nat Genet 44: 1191-1198

作者表明,与乳腺癌风险相关的SNP集中在FOXA1和ESR1的顺反组(cistrome),以及组蛋白H3赖氨酸4单甲基化(H3K4me1)的表观基因组。大多数的风险相关SNP调控FOXA1在远端调控元件的染色质亲和力,这导致等位基因特异的基因表达。

Peifer M., Fernandez-Cuesta L., Sos M. L., George J., Seidel D., et al. (2012) Integrative genome analyses identify key somatic driver mutations of small-cell lung cancer. Nat Genet 44: 1104-1110

作者发现了TP53和RB1失活的证据,并在编码组蛋白修饰物的基因中发现了反复的突变。此外,他们还在PTEN、SLIT2和EPHA7中观察到突变,以及FGFR1络氨酸激酶基因的病灶扩增。这种综合分析表明,组蛋白修饰可能与小细胞肺癌(SCLC)有关。

技术参考

一个良好的实验设计可以提高技术性能,从而产生最易解释和可靠的结果。这里重点强调研究人员在设计实验时必须牢记的生物学和技术的特性。

癌症中的实验设计面临一些独特的挑战。典型的肿瘤样本包含两个基因组:遗传自父母的生殖细胞系(germline)和在疾病发展过程中积累的体细胞突变(somatic mutations)。肿瘤细胞在样本中的比例可能在10%-100%之间。肿瘤基因组也是动态的,会快速积累 *de novo* 突变。因此,每一个肿瘤中又可能同时包含几个克隆亚型。

目前大部分已发表研究的样本量都非常小,可被视为仅是提出了相关的假说。而随着越来越多的测序信息被我们所获得,大部分癌症类型可根据其分子表型,被分成多个亚群。这严重降低了实验的能力,并增加了严格分析所需的样本数量。部分解决这一难题的方案是在探索阶段利用全基因组测序来寻找新的突变。在第二阶段,利用全外显子组或靶向测序来确认新发现的这些突变,并确定他们在大型队列中的丰度。然而,在未来,统计学上严谨的全基因组测序实验有可能是非常大的,需要数千个样本。

使用NGS测序技术进行深度测序是指多次生成定位到同一区域的序列片段,有时达上百次。但由于每条序列片段是从单个DNA分子中产生的,故提高深度测序能够实现原始样品中低至1%的克隆的检测。比较同一个体的肿瘤和癌旁正常组织的序列,我们可以很容易识别浸润组织的序列片段。最佳的读取深度将取决于癌症类型和所需的灵敏度,但一般建议为正常基因组最低为40倍的覆盖深度,而癌症基因组需要80倍以上的覆盖深度。在肿瘤高度异质时,可能需要肿瘤不同部位的多次活检,才能包含所有的细胞类型。

在这个假定的例子中,肿瘤含有两个癌症克隆和邻近组织。肿瘤样本中正常细胞所产生的序列(图中:比对中的前两个序列)可通过与邻近正常组织所产生的序列比较后确定。肿瘤样本中的剩余序列可分为两组,分别代表主要和次要的肿瘤克隆。次要克隆,若不及时治疗,可能在复发时成为肿瘤的主要组分。在实际分析中,肿瘤样本至少要有40倍的覆盖深度,并覆盖靶定的基因集合、全外显子组或全基因组。

检测癌症基因组中的体细胞突变通常有三种方法:全基因组测序、全外显子组测序和靶向基因测序。下表简要介绍了每种方法的有点和缺点。在比较多发性骨髓瘤的全基因组和外显子组测序时,半数的蛋白编码突变通过染色体畸变(如易位)而存在,其中大部分不能单独被外显子组测序而发现。靶向重测序是一种有用的技术,可收录超大队列中已知癌症相关基因的突变。从长远来看,随着我们对基因组的了解日益加深,并且我们处理和解释大型数据集的能力的提高,全基因组测序无疑是最好的肿瘤分子鉴定方法。而在短期内,靶向基因测序可为患者匹配出市场上已有的药物,让他们立刻受益。

(系列完)

参考来源

Illumina cancer research

 

本文固定链接: http://blog.fungenomics.com/2017/01/cancer_genomics_review_3.html | Genomics for fun

该日志由 解螺旋的矿工 于2017年01月31日发表在 癌症基因组 分类下, 你可以发表评论,并在保留原文地址及作者的情况下引用到你的网站或博客。
原创文章转载请注明: 癌症基因组学研究全程回顾(3) | Genomics for fun
关键字: ,

癌症基因组学研究全程回顾(3):等您坐沙发呢!

发表评论

快捷键:Ctrl+Enter