-
生物通官微
陪你抓住生命科技
跳动的脉搏
识别基因功能的新方法
【字体: 大 中 小 】 时间:2003年05月26日 来源:
编辑推荐:
[生物通讯]几乎每周都有一个新基因组被测序完毕,但将序列信息转化为对个体基因的了解还是一个艰巨的任务。发表在上周《生物学杂志》(Journal of Biology)的一篇新研究提出了简化这个任务的方法,文章描述了一个可以大大提高个体基因如何调控的预测准确率的新网络工具。
Wyeth Wasserman博士和他的研究小组发明了一个功能强大的识别哪些转录因子调控哪些个体基因的两步方法。这个新方法比原来的此类方法选择精度大得多,使一次搜索中找到的无关转录因子数目减少了85%。现在,研究人员已通过网络将该工具向所有研究人员公布。
这个基于网络的技术对于分析编码序列未给其功能提供任何线索的基因尤其有用。预测的人类基因中大约有30%不含可识别的域。通过了解哪些转录因子控制一个特殊基因的表达,科学家能够获知这个基因与什么过程有关。这是因为转录因子本身就被严格调控以确保基因只在特定的部位和时间表达,而关于哪些事件可以激活哪些转录因子已有很多了解。
文章作者说:“对一个起调节作用的转录因子身份的了解可以为研究一个基因的功能提供重要线索。”
转录因子是通过结合到编码区上游调控区域的特殊序列起作用的。但它们可以耐受这些序列中存在大量变异。这意味着寻找转录因子结合的上游调控序列也会识别出许多这样的变异位点,它们大多数是生物学不相关序列。
通过将现有的两种方法组合,研究人员成功提高了搜索的“信噪比”。首先,通过扫描寻找调控序列中的结合位点,但寻找的只是已知有生物学活性的位点。为了比较,Wasserman的研究小组汇编一个可搜索的数据库,内含108个来自相关数据库的转录因子结合特征位点。这些位点来自哺乳动物、昆虫和线虫、所有位点都有很好的实验室证据支持。这些实验提供了关于结合位点的内在性质。
第二步,研究人员用一种校正工具比较了两个不同物种的同一基因的调控序列,检查哪些位点在进化中是保守的。“搜索基因组序列调控区域过程中的最有价值的信息就是保守性。如果发现一个区域在人类基因组序列和一个亲缘关系很远的生物中的直向同源基因组序列之间是保守的, 那么该区域就极有可能具有生物学功能。”作者在文中写道。
为检验这个两步方法,研究人员用其识别与已经得到很好研究的14个基因的上游调控区结合的转录因子。通过人类和小鼠的序列,研究人员发现识别出的所有转录因子确实具有生物学功能,只有少数几个生理学相关的调控序列漏网。第二次检验证明,两个输入序列之间的进化距离对于决定该组合方法的有效性至为关键。
现在,这个工具已在ConSite website: http://www.phylofoot.org/网站公布,向所有科学家免费开放。任何对基因研究有兴趣的科学家都可以输入其研究基因的调控序列到ConSite工具中搜索,会得到一个可能的转录因子列表。(生物通编译)