精确肿瘤学中可操作基因融合的功能基因组学方法

【字体: 时间:2022年02月10日 来源:AAAS

编辑推荐:

  精确肿瘤学中可操作基因融合的功能基因组学方法

  

摘要

融合基因是一类具有吸引力的治疗靶点。在癌症患者身上已经发现了数千个融合基因,但其中大多数的功能性后果和治疗意义仍然是未知的。在这里,我们开发了一种功能基因组方法,包括高效融合重建、敏感细胞活性和药物反应分析。应用这一方法,我们在癌症基因组图谱的患者样本中检测到约100个融合基因,揭示了一个显著比例的低频融合对肿瘤生长具有激活作用。针对RTK-RAS通路中的那些,我们发现了一些激活融合,它们可以显著影响对相关药物的敏感性。最后,我们提出了一个完整的证据等级分类系统来系统地划分基因融合的优先级。我们的研究重申了临床上迫切需要采用类似的功能基因组方法来描述基因融合,从而最大限度地利用基因融合进行精确的肿瘤学研究。

简介

肿瘤细胞中的基因融合是一类主要由基因组易位、插入、缺失或染色体反转引起的分子畸变。相当大比例的融合基因驱动肿瘤发生和/或促进肿瘤进展,例如BCR-ABL1型(1),ETV6-NTRK3(2),和TMPRS2型-ETS公司()由于其肿瘤特异性表达和驱动肿瘤病理生理学的能力,融合基因是具有巨大诊断和治疗潜力的靶分子(4,5)全基因组测序技术(TCGA)已将数百种癌症基因的全基因组分析技术(Pan-GA)与下一代癌症全基因组测序技术(TCGA)相结合,使癌症全基因组分析技术从35000种增加到了数百种(69)然而,这些癌症融合基因的功能影响和临床相关性仍知之甚少,这是实现精确癌症医学的关键知识缺口。

许多计算算法已经被发展来预测体细胞点突变的功能影响(10).这些算法的开发和验证得益于一组功能特征突变的“金标准”(11)相比之下,识别驱动基因融合的计算算法的开发和验证受到限制,至少部分原因是缺乏一套功能性特征融合基因的黄金标准集。目前的研究集中在一小组高复发率的基因融合上,以获得详细的功能和机制特征。虽然这是一个合理的做法,以确定目标,可以最大限度地潜在的临床影响,这种方法导致许多罕见的基因融合尚未探索。此外,传统的实验研究只能以耗时和昂贵的方式描述少量的基因融合,这不足以解决临床环境中告知治疗方案的需要。这在很大程度上是由于在敏感和可靠的功能分析中难以创建、表达和描述大量特定基因融合。

在这项研究中,我们开发了一种有效的功能基因组学方法来描述基因融合的细胞后果,并将其应用于大量的融合基因。我们进一步对受体酪氨酸激酶(RTK)–RAS信号通路中涉及的融合进行了深入的分析,包括它们的功能后果和潜在的治疗责任。我们的方法展示了一种潜在的方法来填补基于序列的融合检测和基于目标的临床行为之间的空白。

结果

研究概况

为了确定临床上可操作的基因融合以实现精确的肿瘤学,我们开发了一种有效的功能基因组方法来评估基因融合对功能的影响,并将其应用于在TCGA患者样本中检测到的融合基因(图1A)首先,我们根据之前的两项生物信息学研究,收集了来自33种癌症类型的11000名TCGA患者的约35000个基因融合事件(6,8)我们选择了110个基因融合(主要来自TCGA列表和MD-Anderson患者的另一组),并考虑了它们的相关途径和参与的伴侣基因的潜在药物性。我们用先前描述的第二种融合技术构建了一种多片段融合技术(12)通过直接测序相应的质粒来验证融合构建物的质量。我们只包括那些通过了质量控制步骤的构造,以便进行后续评估。第三,对于每个融合基因,我们通过在信息者细胞系(即Ba/F3和/或MCF10A)中的体外实验来评估其对细胞活力的影响。对于选定的候选人,我们还进行了异种移植瘤检测,以评估其体内致瘤活性。最后,对于上述阳性结果,我们进行药物反应分析以确定其治疗意义。

图1我们的功能基因组学方法概述和融合候选分析。

(A)融合基因功能基因组学平台示意图。开放阅读框1;绿色荧光蛋白****P<0.0001。(B)90个基因融合的靶标分类。TClin,至少含有一种FDA批准药物的基因;具有至少一种ChEMBL化合物的基因,其活性截止值<30nm;以及TBio,没有已知药物或小分子活性的基因。(C)FASMIC的快照:基因融合数据门户。

我们总共获得了90个融合的高质量功能数据(表S1)。为了说明融合伙伴基因的临床相关性,我们使用Pharos数据库对每个伙伴基因进行了注释,这是一个解释可药物基因组的知识库(13)在90个融合基因中,44个(48.9%)融合至少有一个伴侣被归类为TClin,这与至少一个美国食品和药物管理局(FDA)批准的药物有关;33例(36.7%)含有tcem靶点,其中至少有一种ChEMBL化合物的活性截止值<30nm;13例(14.4%)融合没有与已知药物或小分子活性相关的伴侣,注释为TBio(图1B)。值得注意的是,我们的融合中没有一个双方都被注释为TDark,而在法罗斯中,没有什么东西是已知的。

为了促进广泛的生物医学社区利用我们的成果,我们开发了一个用户友好的网站,用于数据可视化和探索(图1C)数据门户包含五个模块:(i)“功能注释”提供与特定基因融合相关的实验数据,包括细胞活性和药物反应分析;(ii)“融合图”以直观的图形显示融合基因结构,并标注位置和蛋白质域信息;(iii)“融合频率”显示不同癌症类型融合发生的频率;(iv)“功能预测”显示融合的预测功能影响得分;(五)“文献综述”展示了文献中有关融合的功能和临床证据。用户可以通过关键词轻松搜索感兴趣的基因融合,或者下载所有数据进行分析。数据门户位于https://bioinformatics.mdanderson.org/public-software/fasmic/.

肿瘤融合基因的大规模功能注释

在我们的功能基因组学方法中,我们主要使用Ba/F3细胞作为“信息者”细胞系来评估特定基因融合对细胞活力的影响。Ba/F3是一种依赖白细胞介素-3(IL-3)促进生长和增殖的小鼠前B细胞系,但在发生致癌事件时可轻易转化为IL-3独立性,因此被广泛用于检测致癌事件(14)检测Ba/F3成瘾从IL-3向癌基因转移的能力已经被用来研究多种癌基因的活性和治疗敏感性(1517)根据基因融合与阴性对照(mCherry和/或荧光素酶)相比是否表现出激活效应,我们将90个基因融合分为两个功能类别:24个激活融合和66个无明显效果的融合。由于表型效应可能取决于细胞环境,我们使用MCF10A对Ba/F3细胞系进行了类似的细胞活性检测,但没有任何影响。MCF10A是一种非肿瘤性乳腺上皮细胞系,广泛用于非锚定非依赖性生长检测,以定量转化活性。我们随机选择了30个在Ba/F3分析中没有明显效果的融合,发现它们在MCF10A中没有激活,这表明我们平台的假阴性率很低。此外,我们还通过对两个模型细胞系(Ba/F3和MCF10A)的基因过度表达分析,评估了132个野生型基因的功能影响。通过与我们的融合注释重叠,24个激活融合中的14个(58.3%)至少有一个伴侣基因对细胞活力有积极(激活)作用,而66个无效应融合中只有9个(13.6%)有一个具有正效应的伴侣基因。这种模式表明激活的融合倾向于涉及具有致癌潜力的基因(χ2测试,P=5.7×10?5;图2A)在90个融合基因中140个独特的伴侣基因中,最常见的4个融合伙伴基因分别是RET公司,FGFR2型,吹牛,和阿尔克。例如,五分之四RET公司融合,五分之三阿尔克融合,两者兼而有之NTRK2融合在报告细胞系中显示激活活性。在超过11000个TCGA样本的融合复发方面,我们发现25.4%的单胎融合(仅在单个患者样本中检测到的融合)的激活效果低于复发融合(35.0%)。在复发性融合中,16例出现于多种癌症类型,其中FGFR3-TACC3,ETV6-NTRK3,和EML4-ALK公司在最热门的激活点击中(图2B)在tcxon试验组中,wilxon效应明显高于tcxon组,P=2.9×10?2),这与癌性融合很可能是阳性选择的观点一致。虽然高复发率的基因融合更有可能对功能产生影响,但我们的结果表明,相当大比例的低频或单基因融合是潜在的驱动事件,可能对特定肿瘤至关重要,并具有治疗效果。

图2.癌症基因融合的大规模功能注释综述。

(A)在激活融合和无效应融合中显示激活效应的伴侣基因的比例。P值基于卡方检验。(B)与特征性复发融合相关的TCGA样本数(左)和癌症类型(右)(在2个样品)。激活的熔丝用红色标记;否则,用蓝色。P值基于威尔科克森检验。(C)激活融合与无效应融合的中心度评分比较。P值基于威尔科克森检验。(D)激活融合与无效应融合在同一染色体或不同染色体上伴侣基因的分布。P基于卡方检验的值。

为了深入了解激活融合基因的系统级特性,我们将我们基于实验的功能注释与基于生物网络中融合伙伴基因特性的计算方法预测的优先级分数进行了比较(18).中心性得分高的融合在我们的方法识别的激活融合中显著丰富,突出了我们的实验方法与计算预测的一致性(Wilcoxon检验,P=2.4×10?;图2C)在所检测的融合基因中,有50个融合基因(55.6%)位于同一染色体上。我们进行了富集分析,以评估融合的功能效应是否与其伴侣基因之间的距离相关。激活融合倾向于有来自不同染色体的基因伴侣(χ2,P=5.1×10?;图2D)这可能是因为转录通读导致的顺式融合(来自同一染色体或相邻基因的基因伴侣)更可能是乘客事件。

RTK-RAS信号通路中的基因融合

RTK-RAS通路在不同的癌症类型中经常被破坏,据估计多达40%的肿瘤在RAS家族的基因中有异常(19).在我们检测的融合中,近一半(42个融合)至少有一个来自RTK-RAS途径的伴侣基因,因此,我们将重点放在该途径上进行深入分析(我们测试的基因融合被突出显示;图3A)在TCGA PanCanAtlas数据集的基础上,我们对RAS途径成员的基因融合进行了系统分析,包括272个基因,主要由RAS倡议定义(20)在9105例TCGA肿瘤中,1289例(14.2%)肿瘤至少有一例融合(图3B)RAS途径融合率最高的是肉瘤(平均每个肿瘤0.8个RAS通路融合)、卵巢癌(0.6)和胶质母细胞瘤(0.6),最低的是肾癌(0.02)和胸腺瘤(0.02)。特别是,297个肿瘤包含一个或多个RAS通路融合,而RAS通路成员没有突变。这些肿瘤可能携带已知癌基因的融合,如阿尔克(TPM1-ALK公司),FGFR3型(FGFR3-ELAVL3),吹牛(MACF1-BRAF公司),和AKT3(ACV2RA-AKT3、ZEB2-AKT3)以及可能影响RAS抑制剂功能的融合(拉萨尔2SPRED2公司)RAS调节肿瘤抑制基因(PTEN,RB1,TP53型,雷达52,和FANC公司)结果表明,这些融合通过激活RTK-RAS通路在肿瘤的发生和/或维持中发挥作用。在992例RTK-RAS通路中同时发生突变和融合的肿瘤中,我们观察到了已知的复发激活融合基因的病例,例如EML4-ALK公司肺腺癌和FGFR3-TACC3膀胱肿瘤。这项观察表明,这些肿瘤中的融合基因可能与RAS通路成员的点突变合作,而不是代表乘客事件。例如,我们能够证明轨道1-RAF1黑色素瘤患者的基因融合表皮生长因子受体,NF1型,PAK3,皮克3CG,PIK3R6,和PLCE1号机组因此,与突变同时发生的先前未确认的融合子集也可能对激活RTK-RAS信号作出显著贡献。

图3RTK/RAS途径融合基因分析总结。

(A)所有42个RTK/RAS融合在实心矩形框中突出显示,括号内的数字表示所分析的相应基因融合的数量。(B)总结33种TCGA癌症类型的所有肿瘤,包括携带RTK-RAS途径基因融合和/或突变的病例(n=9105)。色差的存在显示在是的轴,而所有患者都显示在轴心国。颜色表示肿瘤类型。灰色表示没有RTK-RAS像差。(C)二部网络显示了不同癌症类型的每个融合家族的发生情况。每个边缘的宽度与包含连接融合的患者数量成比例。

图3C显示了我们在TCGA患者队列中分析的42个基因融合的频率摘要(n=9105)。明确地,FGFR公司(五)FGFR2型还有两个FGFR3型融合)的融合频率最高(n=44),在13种癌症类型中检测到,以及NTRK公司熔合(两个NTRK2三次NTRK3融合;n=12)发生在五种癌症类型中。在这些基因融合中,阿尔克,吹牛,RET公司,和FGFR公司是最常见的伴侣基因,每个都有5个融合,因此,我们详细讨论了它们。

阿尔克基因融合

阿尔克[编码间变性淋巴瘤激酶(ALK)酪氨酸激酶受体]基因融合在多种实体瘤中已有报道(21)。在下列情况下EML4公司以及其他阿尔克基因融合,5′伴侣卷曲螺旋结构域的二聚化导致酪氨酸激酶功能的激活阿尔克(22).除了ALK-EML4型肺癌和其他癌症的重排,TPM1-ALK公司在膀胱癌中也有发现。我们发现了TPM1-ALK公司在RNA水平上成熟的mRNA框架转录物,这被不一致的成对末端阅读所证实,这表明在TPM 1阿尔克地点。通过这个事件,大部分的编码序列TPM 1,包括其螺旋线圈结构域,融合到阿尔克包括它的蛋白激酶结构域(图4A).

图4.影响阿尔克细胞活性和药物反应的融合。

(A)基因组结构示意图和mRNA转录本TPM1-ALK公司融合基因。这两个基因的断点都用连接箭头表示。在外显子水平上说明了与肿瘤类型中表达水平相关的mRNA表达水平。红色条表示编码酪氨酸激酶结构域的外显子。(B)Ba/F3细胞存活试验TPM1-ALK公司(平均发光,误差条表示SD,n=3)与阳性对照相比,EML4-ALK公司.GFP=阴性对照。(C)基于定量PCR的野生型全长表达TPM 1阿尔克以Ba/F3表示(平均表达倍数变化标准化为父母阴性对照,误差条表示SD,n=3)。(D)全长野生型Ba/F3细胞存活试验TPM 1阿尔克TPM1-ALK公司(平均发光,误差条表示SD,n=3)。(E)免疫印迹TPM1-ALK公司EML4-ALK公司Ba/F3的表达及信号通路的激活。箭头表示正确的尺寸阿尔克1 TPMEML4-ALK公司. (F)Ba/F3细胞表达的剂量依赖性生存分析TPM1-ALK公司用crizotinib治疗72小时(细胞存活率的平均百分比,误差线表示SD,n=4)。(G)克赖替尼对不同细胞系药物敏感性的比较阿尔克融合。P值基于威尔科克森检验。(H)环唑替尼药物敏感性与药物敏感性的相关性分析阿尔克细胞系中的基因表达阿尔克熔合(H)或无阿尔克熔合(I)。曲线下面积。(J)NVP-TAE684细胞系与不加药的药物敏感性比较阿尔克融合。(K)NVP-TAE684药敏与药物敏感性的相关性分析阿尔克细胞系中的基因表达阿尔克熔合(K)或无阿尔克熔合(L)。(B和D)全部P数值计算方法t试验;ns,不显著****P<10岁?4(G至L)药物数据:CTRPv2。RSEM,RNA序列通过期望最大化。

接下来我们评估了TPM1-ALK公司基因融合在我们的Ba/F3细胞活性检测中的应用。TPM1-ALK公司与表达绿色荧光蛋白(GFP)的细胞相比,Ba/F3细胞的存活和增殖增强了70倍(P<10岁?4)早在去除IL-3后7天(图4B)并对其全长转化活性进行了评价TPM 1阿尔克在Ba/F3分析中。尽管定量聚合酶链反应(PCR)验证表达(图4C)也没有TPM 1也没有阿尔克与融合基因的表达相比,表达能够促进Ba/F3的存活和增殖(图4D).TPM1-ALK公司促进细胞生长的水平相当于EML4-ALK公司(图4B),提示其相关的活性,这进一步得到了它们通过信号转导子和转录激活子3(Stat3)的类似和强大的信号激活的支持,通过对生长期Ba/F3细胞裂解物中磷酸化Stat3(Y705)的免疫印迹分析来评估(图4E)我们接下来进行Ba/F3剂量反应分析,以检查TPM1-ALK公司去碱抑制剂。Ba/F3细胞表达TPM1-ALK公司对克立替尼[中抑制浓度(IC)有明显的敏感性50)=16.5nm],一种ALK激酶抑制剂,临床用于治疗ALK阳性肺癌患者(23),与对照细胞相比(图4F).

概括阿尔克融合上述对ALK抑制剂的敏感性,我们比较了crizotinib和另一种ALK抑制剂NVP-TAE684在有或没有ALK抑制剂的细胞系样本之间的公共细胞系药物敏感性数据阿尔克融合后发现阿尔克融合对ALK抑制剂更敏感(crizotinib,Wilcoxon试验,P=1.4×10?4;图4G;和NVP-TAE684,Wilcoxon测试,P=9.0×10?5;图4J)。我们接下来评估阿尔克通过细胞系的表达观察到阿尔克熔合增加了阿尔克表达式(Wilcoxon检验,P=2.2×10?6;图S1A)。虽然阿尔克在有或无ALK抑制剂的细胞系中,表达水平与药物敏感性显著相关阿尔克融合,内部的关联阿尔克融合细胞系(R) =?0.72和NVP-TAE684,皮尔逊R=?0.74;图4,H和K]比没有阿尔克融合(crizotinib,Pearson'sR=?0.52和NVP-TAE684,皮尔逊R=?0.50;图4,I和L,以及图S1、B和C),表明阿尔克融合,阿尔克表达在预测ALK抑制剂的反应方面更为有效,并且可能表现出更大的依赖性阿尔克作为一名司机。总的来说,这些结果突出了阿尔克融合作为对ALK抑制剂反应的有前景的预测标记物。

皇家空军一号吹牛熔合

以前的研究报告了一些吹牛(B-Raf原癌基因,丝氨酸/苏氨酸激酶)和皇家空军一号黑色素瘤、甲状腺癌和前列腺癌(Raf-1原癌基因、丝氨酸/苏氨酸激酶)基因与不同伴侣的融合(24)。我们的分析确定布拉夫/RAF1与多个伴侣的融合,其中包括已知的基因融合税号1BP1-BRAF轨道1-RAF1黑色素瘤(7,25).研究吹牛/皇家空军一号综合考虑,除了以上两个融合,我们又选择了三个吹牛/皇家空军一号TCGA队列中保留完整蛋白激酶结构域的融合:CLCN6-RAF1(TCGA-ER-A19L),CDC27-BRAF公司(TCGA-FS-A1ZU),以及ATG7-BRAF公司(TCGA-BF-A5EP)(图S2)。我们的Ba/F3分析显示出强劲的驱动因素活性,从30到142倍不等(P<10岁?4)与表达GFP的细胞相比,在缺乏IL-3的情况下(图5A).吹牛Ba/F3的融合活性与表达癌基因的细胞相似吹牛V600E型,在热点V600的一个特征性的致癌事件,在46%的黑色素瘤样本中发现(25).对体外生长的Ba/F3细胞裂解物进行免疫印迹分析皇家空军一号吹牛通过细胞外信号调节激酶1/2(ERK1/2)(T202/Y204)的磷酸化来评估融合表达和增强的丝裂原活化蛋白激酶(MAPK)信号,其也被吹牛V600E型但不是GFP控制(图5B).与之前的观察结果一致,存在吹牛皇家空军一号基因融合与激活相互排斥吹牛/RAS公司70%的黑色素瘤患者都有突变(Fisher精确检验,P=0.018;图5C) (7,25),进一步支持了这些融合代表了这种疾病的司机事件。

图5.影响皇家空军一号吹牛细胞活性和药物反应的融合。

(A)Ba/F3细胞存活试验皇家空军一号吹牛熔合(平均发光,误差线表示SD,n=每组3个)。吹牛V600E型=阳性对照,GFP=阴性对照。(B)免疫印迹法检测Ba/F3中RAF1和BRAF融合表达及MAPK信号激活。(C)TCGA黑色素瘤病例中融合和体细胞突变事件的分布。激活样品拉丝/布拉夫突变以红色显示。(D)Ba/F3细胞表达的剂量依赖性生存分析皇家空军一号用曲美替尼治疗融合72小时。(E)终点体积(CLCN6-RAF1(注射后第23天)CLCN6-RAF1(n=10)和GFP控制(n=10)。(F)曲美替尼对不同细胞系药物敏感性的比较皇家空军一号融合。P值基于威尔科克森检验。药物数据:GDSC。(G)预注射HMEL细胞和肿瘤细胞裂解物的免疫印迹分析CLCN6-RAF1。(H)吹牛用曲美替尼处理融合72小时(细胞存活率的平均百分比,误差线表示SD,n=4(所有组)。()终点体积(税号1BP1-BRAF(注射后第43天)税号1BP1-BRAF(n=10)和GFP控制(n=10)。水平条表示平均体积;误差线表示SD。(J)免疫印迹法分析预注射的HMEL细胞、肿瘤和肿瘤衍生细胞表达的裂解产物税号1BP1-BRAF(A和E)全部P计算值依据t试验****P<10岁?4.

为了研究这些融合的治疗效用,我们进行了剂量反应抑制剂试验,结果显示对MAPK激酶(MEK)抑制剂曲美替尼(IC)具有显著的敏感性50,CLCN6-RAF1=1.223牛米轨道1-RAF1=0.9588 nM),在Ba/F3细胞中表达皇家空军一号熔合(图5D)从融合后MAPK信号的强烈激活可以预测到(图5B)接下来,我们利用原代人类黑素细胞(HMELs)来验证黑色素瘤衍生融合基因的转化活性(26,27),是评估黑色素瘤特异癌基因致瘤活性的理想方法。原位注射HMEL细胞表达CLCN6-RAF1在无胸腺小鼠的真皮中发现了它强大的致癌活性(100%的肿瘤外显率,n=10;图5E)与表达GFP的对照细胞相比(n=第0页,共10页)。我们还观察到内源性皇家空军一号利用细胞系药物敏感性数据(Wilcoxon试验,P=0.026;图5F),与皇家空军一号融合是肿瘤行为的驱动因素。这也表明皇家空军一号融合可作为曲美替尼和其他可能的RAS/MAPK途径抑制剂的潜在益处的预测标记物。为了支持这一论点吹牛trametinib(IC)融合致敏Ba/F3细胞50,税号1BP1-BRAF=0.9107牛米,CDC27-BRAF公司=0.6334牛米,以及ATG7-BRAF公司=1.148牛米;亲本=45 nM;图5H)我们观察到在注射稳定转染的HMEL细胞时也有类似的效果吹牛融合,税号1BP1-BRAF极大地促进了肿瘤的生长(图5I)与对照组相比,注射了四种细胞的肿瘤没有形成(n=第0页,共10页)。细胞和肿瘤裂解物的免疫印迹分析得到证实CLCN6-RAF1税号1BP1-BRAFMAPK信号转导与GFP表达HMEL细胞的比较(图5,G和J).这些结果表明,尽管合作伙伴存在显著的差异,皇家空军一号吹牛融合是黑色素瘤和其他肿瘤谱系中一类重要的可操作事件。

FGFR公司熔合

成纤维细胞生长受体基因的癌基因重排FGFR1型 FGFR2型,FGFR3型,和FGFR4型以前有过报道(28).FGFR公司在TCGA队列中发现了20种癌症类型的基因融合,其中包括复发性融合WHSC1L1-FGFR1,FGFR2-BICC1,和FGFR3-TACC3(图6A).与以前的研究一致(2931),FGFR2-BICC1FGFR3-TACC3在我们的Ba/F3活性测定中显示出显著的激活作用。一个有趣的例子是FGFR3-ELAVL3在低级别胶质瘤中检测到融合,其中基因组断点位于FGFR3型自从融合记录FGFR3-ELAVL3希望保留的终止密码子FGFR3型,这个转录本的翻译不能产生融合蛋白。然而,通过选择性的mRNA剪接,最后一个外显子带有3′UTRFGFR3型会被剪接出来,而之前的外显子FGFR3型因此融合到ELAVL3号,生成帧内转录本(图6B).以前的研究表明FGFR3-TACC3融合是通过失去microRNA对3′UTR的控制而起作用的FGFR3型(32);同样,这里描述的融合将有助于减少FGFR3型通过肿瘤抑制基因microRNAs。

图6.频率和功能效应FGFR公司融合。

(A)TCGA泛癌FGFR融合的总结。(B)基因组结构示意图和mRNA转录本FGFR3-ELAVL3. (C)MCF10A锚地-独立菌落形成分析FGFR3-ELAVL3(10个随机区域的平均菌落计数,误差条表示SD,n=3)。PIK3CA公司H1047R型=阳性对照,GFP=阴性对照。(D)免疫印迹FGFR3-ELAVL3MCF10A的表达及信号通路的激活。全部P计算值依据t试验***P<0.005和****P<0.0001。膀胱尿路上皮癌;乳腺浸润癌;宫颈鳞状细胞癌和宫颈腺癌;胆管癌;食管癌;GBM,多形性胶质母细胞瘤;头颈部鳞状细胞癌;肾乳头状细胞癌;急性髓系白血病;LGG,脑低级别胶质瘤;肝细胞癌;肺腺癌;肺鳞状细胞癌;卵巢浆液性腺癌;前列腺癌;皮肤黑色素瘤;胃腺癌;甲状腺癌;子宫内膜癌;还有UVM,葡萄膜黑色素瘤。

我们评估了FGFR3-ELAVL3用菌落分析法在MCF10A细胞中融合。我们发现FGFR3-ELAVL3导致菌落形成显著增加(12倍,P=5×10?4;图6C)与致癌物相似PIK3CA公司H1047R型控制(33)免疫印迹分析(图6D)MCF10A细胞表达FGFR3-ELAVL3ERK1/2(T202/Y204)和S6(S235/236)的磷酸化水平升高,这与FGFR3型在激活MAPK通路中的已知作用(34)并观察其他FGFR3型基因融合,如FGFR3-TACC3事件(35)这在多种癌症中都存在。

一种基于证据的分类方法,为精确肿瘤学确定可行的基因融合优先级

基于我们开发的功能基因组学方法和从上述分析中获得的见解,我们提出了一个完整的证据级别分类系统,系统地对基因融合进行优先排序,以传达单个融合事件的临床效用,该系统由四个级别组成(图7A)具体来说,4级(L4):融合存在证据,通过肿瘤测序数据确定的基因融合;L3:基于相关性的证据,融合显示与整体药物敏感性显著相关,例如。,皇家空军一号融合到曲美替尼(图5F);L2:功能证据,在体外和/或体内对肿瘤生长或药物反应有显著影响的融合,例如。,税号1BP1-BRAF1(图5、D和H);L1:临床证据,与患者数据中预测治疗反应的证据相融合,例如。,EML4-ALK公司肺癌。水平越低,基于肿瘤中鉴定出的特定基因融合治疗患者的证据就越有说服力。

图7一个基于证据的分类系统,用于优先考虑可行的基因融合。

(A)精确肿瘤学中可操作基因融合的四级循证分类系统概述。野生型。(B)根据TCGA患者队列中确定的融合,总结RTK-RAS途径中的融合分类。L2融合只包括我们功能性评估的融合,L1融合包括有临床证据的融合,不一定在本研究中评估。***表示统计显著性。(C)临床环境下融合功能评估流程的时间表。

接下来,我们将上述分类应用于完整的TCGA患者队列,重点关注RTK-RAS通路,我们拥有最丰富的功能证据。总共,在超过11000名患者中,我们在1450名患者中发现1653个L4融合影响RTK-RAS通路的成员,范围从37.2%不等(n=97),肾嫌色性肉瘤为0.9%(n=1);237例中177例L3融合;根据本研究中产生的功能证据,86例患者中有23例L2融合(例如,44例患者携带FGFR公司熔合);129例患者中有5例L1融合(图7B)这项分析阐明了我们的功能基因组学平台是如何使系统化的方法来识别潜在的临床可操作的融合事件。为了提高临床效果,我们对流程中的每一步都进行了优化,以便从患者肿瘤的RNA测序数据中识别融合候选物到完成体外细胞活力和药物敏感性分析的整个过程可以在7周内完成(图7C)此外,与我们的基因合成方法相比,这种方法可以大大降低基因合成的成本。

讨论

在这项研究中,我们开发了一种功能基因组学方法来测试融合基因的转化潜能和药物反应性,并展示了该方法的可扩展性,包括在临床相关时间尺度上进行分析的能力。该方法成功率高(>80%),具有时间效率和成本效益。这里描述的基因融合为评估预测癌症驱动基因融合的计算算法提供了一套黄金标准。我们发现相当一部分低频(甚至是单基因)基因融合具有功能效应和潜在的治疗相关性,这对患者管理具有重要意义。尽管融合基因已经代表了几十年的治疗靶点(例如,靶向BCR-ABL公司慢性粒细胞白血病的治疗发生了显著改变),功能特征和治疗努力主要集中在高复发性融合候选。我们的研究重申,迫切需要考虑将低频融合作为潜在的治疗目标,以实现个性化癌症治疗的全部前景。由于我们的功能分析方法可以在相对较短的时间内(如7周)完成,我们建议该方法可应用于临床,以识别可能驱动肿瘤行为的功能融合基因,并预测对特定治疗方案的反应。

我们认识到我们的方法有一些局限性。首先,我们主要用Ba/F3作为模型细胞系来评估基因融合的功能效应。虽然大多数已知的功能性融合基因(例如。,FGFR3-TACC3ETV6-NTRK3)系统中可能有“F3/Ba不活跃”的“系统中的某些谱系可能不活跃”。例如,KLK2-FGFR2型在nih3t3模型中,前列腺腺癌和葡萄膜黑色素瘤被认为是一种潜在的致癌事件,并被报道改变细胞形态和促进迁移(36)然而,我们使用第二个信息者细胞系MCF10A进行的平行评估表明,我们平台的假阴性率可能很低。第二,我们主要使用细胞活性分析作为表型效应的读数,这并没有捕捉到致癌驱动因素的所有功能后果。然而,在多个系统中,这种表型分析报告了患者对治疗的反应。作为对活性检测的补充,我们还探索了其他功能检测,如克隆形成检测。第三,我们的方法可能在敏感的Ba/F3信息体细胞系中发现一些融合阳性,在特定的谱系背景下可能有更温和的影响。我们评估活化融合药物敏感性的策略应该可以减轻这种担忧。总的来说,我们设计这种方法是为了在实验效率和表征的全面性之间提供一个很好的平衡,目的是能够为临床决策提供及时的支持。需要进一步的努力来改进我们的方法来捕捉更多的“上下文相关”的表型效应。

我们提供了一个全面的观点,从基因融合的RTK-RAS途径跨越33种癌症类型。我们的研究结果表明,除了基因的高频激活突变,如V600E吹牛和G12D英寸克拉斯,基因融合也可以对RTK-RAS通路的激活起到较小的作用,但仍然是令人信服的。总的来说,虽然大约每七个测序肿瘤中就有一个携带RTK-RAS通路成员的融合基因,但不同癌症类型的RTK-RAS通路中融合基因的频率存在显著差异。这一观察结果与先前的研究一致,这些研究表明,在黑色素瘤等肿瘤中,RAS突变的激活占优势(25),胰腺,食管(37)膀胱癌(38)此外,某些实体瘤似乎比其他实体瘤更容易融合,如甲状腺癌,尽管其结构“安静”,但其RTK-RAS融合基因的突变负担相当大(39)同样,肉瘤似乎含有频繁的融合基因,这些基因很可能是肿瘤的驱动因素(40)像黑色素瘤和胃腺癌这样的癌症类型通常含有超重组的基因组区域,其中包括RTK-RAS通路基因,这些基因有可能导致功能相关的融合基因。

虽然特异性基因融合个别罕见,但它们共同对RTK-RAS通路的激活做出了重大贡献。有许多治疗方法可以抑制RTK-RAS通路成员,目前已有或正在研究中。例如,我们的研究确定了两个驱动因素遇见熔合(BAIAP2L1-MET公司TFG-MET公司)至少有一个正在进行的针对MET融合阳性肿瘤的临床试验(NCT02978261)。因此,即使没有FDA批准的药物,我们的功能基因组学方法确定的致癌融合可以被添加到有希望的治疗目标的可行列表中。除了临床认可的复发性靶点,如BCR-ABL公司白血病和阿尔克ROS公司肺癌融合,积累的数据支持临床对罕见畸变的反应。例如,一个病例报告显示两个转移性黑色素瘤患者吹牛当用MEK抑制剂曲美替尼治疗时,两者的融合症状都有改善(41).与靶向性罕见融合相关的积极临床结果支持了对治疗模式的考虑,根据这种融合的存在独立于组织或肿瘤来源来治疗患者。功能性信息,如这里提供的信息,或通过治疗获得的关于特定融合的信息,将大大提高基于特定罕见融合基因治疗患者的信心。因此,当前病人分层策略的一个不可或缺的因素是基因融合的功能特征,潜在的重点是药物靶点。为了达到这个目标,我们的功能基因组方法和提出的四级循证分类系统代表了一个初步但关键的尝试,以改善针对罕见基因融合事件的临床影响。

材料和方法

老鼠

雌性裸鼠-狐狸14~6周龄;查尔斯河实验室]被用于异种移植瘤研究。在饲养和居住条件下,所有老鼠都被随意喂食标准的杂粮,并被安置在一个无病原体的设施中,在兽医的监督下,每个笼子不超过5只老鼠,且温度、湿度和明暗循环(12小时)条件下,在贝勒医学院国际实验动物护理评估与认证协会认证动物设施。所有动物程序都经过贝勒医学院动物护理和使用委员会(AN-5428)的审查和批准。

细胞系

293T细胞[美国类型培养集(ATCC)]培养在杜尔贝科改良的Eagle培养基(Thermo Fisher Scientific)中,并添加10%胎牛血清(FBS;Thermo Fisher Scientific)。亲代Ba/F3细胞在RPMI 1640培养基(Thermo Fisher Scientific)中培养,添加5%FBS(Thermo Fisher Scientific)和重组小鼠IL-3(2.5 ng/ml;研发系统)。MCF10A细胞(ATCC)如前所述进行培养(42).HMEL细胞(26)在添加10%FBS、青霉素(100u/ml)和链霉素(100μg/ml)的RPMI 1640培养基中培养。所有细胞系在37℃和5%CO条件下培养2空气加湿。在MD-Anderson癌症中心使用短串联重复序列(STR)测试平台对细胞系核心设施进行了鉴定。

基因融合选择

为了平衡发现能力和评估偏差,我们从TCGA患者中选择100个融合基因,基于两个因素,融合伙伴基因的潜在药物性和RTK-RAS通路的参与。在伴侣基因的药物性注释方面,我们设定TClin为50%,tcem为35%,TBio为15%;对于TClin,我们进一步将RTK/RAS设置为80%;对于TCEM,我们将RTK/RAS设置为20%。然后,基于这些预先确定的估计,我们从每个类别中选择相应数量的融合候选。此外,我们还包括了在MD-Anderson患者样本中检测到的一些基因融合。共筛选出110个基因融合。

基因融合构建

如前所述,融合基因构建物是使用网关多片段重组技术生成的(12)简单地说,融合基因的构建是基于PCR,使用与ORFeome合作获得的每个融合基因片段相对应的序列验证开放阅读框(ORF)(www.orfeomecollaboration网站。组织),哺乳动物基因收集,和商业化的ORF来源(最终的ORF克隆;生命技术)作为PCR模板。分别用PCR扩增出左(门)臂和所需的基因片段。通过BP重组(Life Technologies),将左右臂PCR产物分别整合到pDONR载体(Life Technologies)和pFUSE-B载体(Addgene,质粒号97185),然后按照制造商的建议,通过LR重组反应(Life Technologies)将多片段重组到pFUSE-DEST_R1R4载体(Addgene,质粒号97186)。反应混合物在室温下培养过夜,随后转化为STBL3(生命技术)活性细菌。

Ba/F3细胞活力测定

慢病毒的产生和转导Ba/F3细胞在Ng. (17)简单地说,用含有融合基因的载体和包装质粒(psPAX2和pMD2.G)转染Lenti-x293t细胞。转染后3天取慢病毒,于1000时用棘球法转染Ba/F3细胞g在聚布伦(最终浓度为8μg/ml)存在下持续3小时。对于Ba/F3转化潜能测定,如前所述,将转化的Ba/F3细胞在不含IL-3的培养基中培养7天(15,16)用细胞滴度Glo(Promega)测定细胞活力。在抑制剂检测中,稳定表达融合的Ba/F3细胞(在无IL-3培养基中)和亲本Ba/F3(在常规培养基中)以4份种子接种在96孔板中,每孔1000个细胞。用不同浓度的二甲基亚砜或相应的抑制剂处理细胞72小时,用细胞滴度Glo(Promega)测定细胞活力。至少进行了两个独立的实验。所有抑制剂化合物均购自Selleck Chemicals。

MCF10A安克雷奇-独立生长分析

通过慢病毒感染将融合基因导入MCF10A细胞。如前所述(12)软琼脂试验在6孔板中进行,一式三份。首先,用0.8%贵琼脂(Affymetrix公司)和完整的MCF10A培养基制备底层。凝固后,将10000个细胞与0.45%琼脂混合,置于最底层。3天后每孔加入2毫升培养基,每3天更新培养基。接种2周后计数菌落数。

免疫印迹法

细胞和肿瘤组织用含有蛋白酶抑制剂鸡尾酒(Sigma-Aldrich)和磷酸酶抑制剂鸡尾酒(Calbiochem)的放射免疫沉淀试验缓冲液进行裂解。蛋白质裂解物在4~12%双三硅凝胶(Novex)上分离,转移到聚偏二氟乙烯膜上。以下抗体用于检测表达:Raf1(Abcam)、BRAF(B-Raf原癌基因、丝氨酸/苏氨酸激酶)(Santa Cruz Biotechnology)、磷酸化Erk1/2(T202/Y204)(细胞信号技术)、Erk1/2(细胞信号技术)和甘油醛-3-磷酸脱氢酶(Santa Cruz Biotechnology)。

体内异种移植瘤检测

所有使用小鼠的研究都是按照贝勒医学院动物护理和使用委员会批准的动物方案(AN-5428)进行的。将100万个细胞重新悬浮在1:1的Hanks's平衡盐溶液(Life Technologies)和Matrigel(BD Biosciences)中,并将其注射到雌性变态小鼠双侧腹皮下或直接注射到真皮中(27)每周监测2次,测量肿瘤体积,以长×宽计算体积2/2。

TCGA基因融合的生物信息学分析

基于先前的两项生物信息学研究,收集了来自33种癌症类型的11000例TCGA患者的基因融合事件(6,8)从TCGA肿瘤标本中鉴定出RTK-RAS途径基因的体细胞突变来自TCGA泛癌分析(19)中心度评分来自肿瘤应用数据库(8)在TCGA-Pan-Cancer分析确定的RTK-RAS通路的基础上,获得RTK-RAS通路的相关基因并进行融合(19)以及RAS倡议(20).利用Cytoscape构建融合癌二部网络(www.cytoscape。组织)基于TCGA患者队列中确定的融合频率。

药物敏感性分析阿尔克皇家空军一号基因融合

药敏数据来源于肿瘤药物敏感性基因组学(GDSC)(www.cancerrxgene。组织)癌症治疗反应门户网站(CTRP)v2(https://portals.broadinstitute.org/ctrp/)细胞系样本中的基因融合和相应的基因表达数据来源于肿瘤细胞系百科全书(https://portals.broadinstitute.org/ccle).有无细胞系药物敏感性(曲线下面积)的差异分析阿尔克皇家空军一号融合采用Wilcoxon试验。之间的联系阿尔克皇家空军一号基因表达和ALK或RAF抑制剂通过Pearson相关试验进行评估。

基于证据的基因融合优先排序系统

使用TCGA数据,我们应用了中定义的分类系统图7A优先考虑与RTK-RAS通路有关的L4-L2可操作基因融合。从TCGA基因融合列表中筛选出在RTK-RAS途径中至少有一个伴侣基因的L4融合。对每个癌组织中存在RTK-RAS融合的患者数量进行计数,以生成绿色条形图图7B为了说明L3融合,我们利用从GDSC和CTRPv2获得的药物敏感性数据对每对RTK-RAS基因及其相应的抑制剂进行了药物敏感性差异分析。在错误发现率<0.2的情况下选择有意义的基因。在热图中进一步统计和总结了携带这些重要基因的融合患者。我们的功能平台注释的激活融合被注释为L2融合。我们进一步从TCGA患者队列中识别出L2融合的患者,并在条形图中按每个基因家族分组(例如。,FGFR公司NTRK公司).

数据门户开发

CouchDB以及第一个加载到功能性元数据中的CouchDB。融合基因频率是从两个先前的研究中获得的(6,8)文献资料采用人工整理。融合图是在生成棒棒糖图的命令行工具的基础上开发的。柱状图是由Highcharts生成的。交互表由DataTables生成。

量化与统计分析

使用R(版本3.6.1)进行统计分析。为了评估两个连续变量之间的相关性,采用Pearson相关检验;为了评估两个分类变量之间的相关性,采用卡方检验;比较两组的平均值,威尔科克森和学生的平均值t使用了测试。统计试验的详细说明见材料和方法以及相应的图形图例。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号