编辑推荐:
为探究 Tn7 样转座子与 CRISPR - Cas 系统新的作用方式,康奈尔大学研究人员开展相关研究,发现一类靶向 CRISPR 阵列的 Tn7 样转座子。这一成果拓展了对两者互作多样性的认知,极具科研价值,推荐阅读!
在神秘的微生物世界里,有一种神奇的 “小机灵鬼”—— 转座子(Transposons),它们就像一群不安分的 “基因搬运工”,能够在基因组的不同位置之间跳来跳去。而 Tn7 和 Tn7 样转座子更是其中的 “佼佼者”,以精准选择目标位点进行转座而闻名。
通常情况下,Tn7 样转座子有两种主要的 “导航系统” 来寻找目标。一种能识别宿主染色体上的保守位点,就像是在茫茫基因组中找到了熟悉的 “地标”,实现垂直传播;另一种则能识别像结合 / 移动质粒这样的其他可移动元件,帮助转座子 “跳槽” 到新的宿主,完成水平传播。比如,典型的 Tn7 采用 “剪切 - 粘贴” 的方式,由 TnsA 和 TnsB 蛋白组成的转座酶团队合作,将转座子从供体位置完整切下,再精准插入到受体 DNA 中。还有一些 Tn7 样元件,它们的 TnsA 和 TnsB 蛋白会融合在一起,形成独特的转座酶。不管转座酶的结构如何变化,只有当专门的目标位点选择蛋白或系统找到合适的目标 DNA,并通过信号蛋白 TnsC 与转座酶 “沟通” 后,转座酶才会被激活,开启转座之旅。
随着研究的深入,科学家们发现 Tn7 样转座子与 CRISPR - Cas 系统(一种细菌的 “免疫系统”,能利用短的重复 DNA 序列和间隔序列来识别和抵御外来的遗传物质)之间存在着奇妙的联系。一些 Tn7 样转座子巧妙地 “借用” 了 CRISPR - Cas 系统,将其改造成 RNA 引导的转座工具,这就是所谓的 CRISPR 相关转座子(CASTs)。在 CASTs 中,CRISPR 系统失去了原本降解 DNA 的 “防御功能”,转而与转座机制紧密合作,帮助转座子实现精准转座。
然而,在这个充满奥秘的领域,仍有许多未解之谜。比如,是否还存在其他新颖的 Tn7 样转座子与 CRISPR - Cas 系统的相互作用方式呢?为了探索这些未知,来自康奈尔大学(Cornell University)微生物学系的 Laura Chacon Machado 和 Joseph E. Peters 在《Mobile DNA》期刊上发表了一篇题为 “A family of Tn7 - like transposons evolved to target CRISPR repeats” 的论文。他们发现了一类全新的 Tn7 样转座子,这类转座子有着独特的 “偏好”—— 专门瞄准 CRISPR 阵列,这一发现为我们理解移动遗传元件和细菌防御系统之间的关系打开了一扇新的大门。
研究人员在研究过程中使用了多种技术方法。首先,他们运用生物信息学工具,通过从美国国立生物技术信息中心(NCBI)的 FTP 站点下载蓝藻(Cyanobacteria)的注释基因组序列和特征表,利用欧洲生物信息学研究所(EMBL - EBI)Pfam 数据库中与 TniQ 相关的 HMMprofile(PF06527),借助 hmmsearch(HMMER3)来检测同源物,从而对转座子进行全面的分析和筛选。之后,通过 MUSCLE 进行序列比对,并用 FastTree 构建相似性树,在 iTOL 中进行可视化展示,以此来探究转座子的系统发育关系。此外,他们还使用了 AlphaFold3 预测蛋白质的三维结构,借助 ChimeraX 进行可视化分析,深入了解蛋白质的结构特征 。同时,利用 CRISPRDetect 分析 CRISPR 阵列的序列和方向。最后,通过交配出实验(mating - out assay)来检测转座子的活性。
下面我们来详细看看他们的研究结果。
一、靶向 CRISPR 阵列的 Tn7 样转座子
在对 DNA 数据库的 “大搜索” 中,研究人员偶然发现了一个有趣的现象。在丝状蓝藻 Allocoleopsis franciscana PCC7113 的质粒 pMIC7113.03 中,有两个相同的 Tn7 样转座子,它们分别位于不同的 CRISPR 阵列中。与之前发现的 CASTs 不同,这个转座子自身并不携带 CRISPR - Cas 系统的基因,相关基因在转座子边界之外,且与之相邻。虽然在 Allocoleopsis franciscana 的染色体上也发现了类似的转座子,但由于转座酶基因存在无义突变,可能没有功能。而在另一个 Allocoleopsis sp. 的部分基因组中,研究人员找到了一个高度相似且预测功能完整的转座子,这表明这类转座子在蓝藻群体中可能是活跃的。
二、靶向阵列的转座子家族
研究人员以 A. franciscana 的 TnsD 氨基酸序列为 “线索”,利用 BLAST 算法进行同源性搜索,发现了 16 个独特且密切相关的同源物,它们的相似度在 50% - 90% 之间。进一步分析发现,这些同源物与 19 个具有相似特征的转座子有关。这些转座子都有一些共同特点,比如 TnsA 和 TnsB 蛋白融合,拥有 TnsC AAA + 蛋白和单个 TnsD 样靶标选择蛋白,并且 TnsD 同源物都保留了参与 DNA 结合的 CCCH 锌指基序。令人惊讶的是,约 82%(22 个中有 18 个)能确定边界的转座子都位于 CRISPR 阵列中,这强烈暗示 CRISPR 阵列是这类转座子的 “心头好”。而且,在同一基因组、同一物种的不同菌株或密切相关的物种中,还发现了许多相同或高度相似的转座子拷贝,这说明它们可能在近期还 “活跃” 地进行了转座活动。另外,这个家族中的转座子大多不携带 “货物基因”(编码那些不直接参与转座过程,但能为宿主提供有益功能,如噬菌体防御系统或抗生素抗性决定子的基因),只有少数成员携带的额外遗传信息,还是一些插入后破坏了核心转座基因的其他移动遗传元件。
三、靶向阵列的元件与靶向 tRNA 的元件密切相关
为了搞清楚靶向阵列的转座子在进化上的 “身世”,研究人员进行了 HMMER 搜索,构建了非冗余 TnsD/TniQ 蛋白的相似性树。结果发现,在蓝藻中,靶向阵列的转座子在进化关系上与 TnsD 介导的靶向 tRNA 的转座子非常接近。tRNA 基因是细菌中移动元件整合的 “热门地点”,就像一个热闹的 “基因驿站”。通过对比,研究人员发现靶向 tRNA 的 TnsD 蛋白和靶向阵列的 TnsD 蛋白之间有一个明显的结构差异:靶向 tRNA 的 TnsD 蛋白有一个 C 末端基序,而靶向阵列的 TnsD 蛋白却没有。AlphaFold3 预测这个缺失的区域是一个螺旋 - 转角 - 螺旋结构域(HTH),并且已知 TnsD 的 C 末端区域参与了典型 Tn7 中靶标的特异性 DNA 结合,由此推测它在其他 TnsD 样蛋白中可能也有类似功能。
四、tRNA 基因和 CRISPR 阵列的共同序列提供线索
研究人员通过仔细比对靶向 tRNA 和靶向阵列的转座子两端的 DNA 序列,发现了一个有趣的现象:在距离转座子左端 40 - 50bp 的位置,有一个保守的 DNA 基序。这个基序在 tRNA 基因和 CRISPR 阵列的重复序列中都存在,即使有些靶向阵列的转座子不在 CRISPR 阵列附近,其预测的靶标仍然保留了这个序列匹配。这说明这个保守序列在转座子的整合过程中可能起着关键作用。从 AlphaFold3 对 McTnsD - 靶 DNA 复合物的建模可以看出,McTnsD 有四个不同区域与 tRNA - Leu 基因末端相互作用,其中一个被识别的区域在 CRISPR 阵列中也保守存在,但 McTnsD C 末端 HTH 结构域识别的蓝色区域在 CRISPR 阵列中却没有对应部分。
五、靶向阵列元件的亚组特化的遗传证据
根据 TnsD 的相似性,研究人员将靶向阵列的转座子家族分为三个亚组。深入研究后发现,每个亚组都有独特的特征。比如,蓝色分支的转座子进化出了异常大的右端,平均长度达到 500bp,而且其 TnsB 结合位点的分布和方向与其他两个分支以及来自 M. californica 的 I - D CAST 都有很大差异。有趣的是,那些在相同或密切相关基因组中多次出现的转座子大多位于这个亚组,这从侧面表明这个亚组的转座子可能具有更高的转座活性,但这些差异背后的机制还不清楚。
六、靶向阵列的元件无法在异源大肠杆菌宿主中建立
研究人员尝试将来自 A. franciscana 和 Calothrix sp. 的靶向阵列系统,通过交配出实验在大肠杆菌宿主中建立起来。他们还设置了阳性对照,选用了之前已在异源大肠杆菌宿主中成功建立的来自 M. californica 的 TnsABCD 系统。然而,结果令人意外,在测试条件下,所有评估的靶向阵列元件都没有表现出靶向或随机转座活性。研究人员还进行了异源互补实验,将靶向阵列和靶向 tRNA 的元件的核心蛋白和靶标进行不同组合,但都没有检测到活性。此外,他们通过删除 McTnsD 中靶向阵列元件缺失的 C 末端片段,发现这会导致转座活性完全丧失,这表明这个区域对于靶标识别至关重要。
综合这些研究结果,研究人员得出结论:他们发现了一类蓝藻中的 Tn7 样转座子,这类转座子很可能将 CRISPR 阵列中的重复序列作为附着位点。从进化角度看,它们与靶向 tRNA 的 Tn7 样转座子似乎有着共同的祖先。由于 CRISPR - Cas 系统在染色体和移动质粒中都很常见,靶向 CRISPR 重复序列为这些转座子在染色体中提供了稳定的 “栖息地”,也为它们借助质粒转移到新宿主提供了便利。虽然这些转座子是 “极简主义者”,不携带遗传 “货物”,但它们有可能在细菌间移动 CRISPR - Cas 系统的过程中发挥作用。
这些发现意义重大。一方面,它丰富了我们对 Tn7 样转座子和 CRISPR 系统之间相互作用多样性的认识,让我们看到了这两个微观世界 “主角” 之间更多奇妙的联系。另一方面,对于理解细菌的遗传进化和适应性也有重要价值。这类转座子如何在不影响 CRISPR - Cas 系统功能的前提下实现自身的转座,以及它们在细菌群体中的传播机制等问题,都为后续研究提供了新的方向。不过,目前蓝藻基因组数据有限,大部分相关元件都存在于碎片化的重叠群中,这给深入研究带来了挑战。但这也意味着,随着更多蓝藻基因组被测序和研究,可能还有更多有趣的遗传奥秘等待我们去揭开。