-
生物通官微
陪你抓住生命科技
跳动的脉搏
中科院博士:如何分析海量DNA序列数据
【字体: 大 中 小 】 时间:2009年12月15日 来源:生物通
编辑推荐:
生物通报道,中国科学院昆明动物研究所疾病机理遗传学和进化医学实验室的姚永刚博士联合其他科学家对如何分析和挖掘Genbank中的mtDNA数据进行了详解,相关成果文章公布在《The American Journal of Human Genetics》上。
生物通报道,中国科学院昆明动物研究所疾病机理遗传学和进化医学实验室的姚永刚博士联合其他科学家对如何分析和挖掘Genbank中的mtDNA数据进行了详解,相关成果文章公布在《The American Journal of Human Genetics》上。
大名鼎鼎的Genbank恐怕是无人不知无人不晓的,里面所存在的信息量恐怕可以用海量还形容,GenBank以指数形式增长,核酸碱基数目大概每14个月就翻一个倍。面对如此大的信息量,如何从中选择并分析DNA序列也是门学问。
在各种细胞器中,线粒体具有特殊性,因其含有核糖体且自身带有遗传物质。线粒体DNA是环状的,且有一些和标准真核生物遗传密码不同的变化,在人类的生命活动中扮演着重要的角色。 mtDNA分子为环状双链DNA分子,外环为重链(H),内环为轻链(L )。基因排列非常紧凑,除与mtDNA复制及转录有关的一小段区域外,无内含子序列。每个线粒体含数个m tDNA,动物m tDNA 约16-20kb,大多数基因由H链转录, 包括2个rRNA , 14个tRNA 和12个编码多肽的mRNA , L链编码另外8个tRNA和一条多肽链。mtDNA上的基因相互连接或仅间隔几个核苷酸序列, 一些多肽基因相互重叠, 几乎所有阅读框都缺少非翻译区域。很多基因没有完整的终止密码, 而仅以T或TA 结尾,mRNA的终止信号是在转录后加工时加上去的。
对mtDNA全基因组测定分析已成为医学、分子人类学及法医学研究中的重要手段。目前全球已有6700多个个体的mtDNA全基因组序列得到测定,相关的数据保存在公共数据库如GenBank中,可供研究者进行重新分析和挖掘。
由于各种原因,某些测定的mtDNA全序列数据存在不同程度的错误,后续的分析工作如果没能充分剔除这些错误,而仅对数据库中现有的数据不加选择的进行分析,有可能会得出错误的结论。如近期Pereira等人发表的针对5140条人类mtDNA全基因组序列分析的文章(Am. J. Hum. Genet. 84, 628–640),就受到这种问题的影响。
针对这种情况,姚永刚博士与德国Hans-Jürgen Bandelt教授、西班牙Antonio Salas博士和英国Ian Logan博士进行了一项合作研究。他们分析了GenBank数据库中一些问题较多的数据集,指出Pereira等人不加选择地利用数据库中的数据进行分析存在的多种问题。在他们自己分析工作的基础上,姚永刚等人就GenBank数据库中问题较多的mtDNA全基因组数据开出了一个长长的名录,便于后续研究者在分析时剔除这些序列。同时,他们对研究者如何提高数据质量提出了若干建议,如向数据库提交序列之前,研究者应该对数据进行仔细的检查和精确的核对,避免错误出现。对存入数据库中的序列,如果发现错误,应该及时更正并更新。
(生物通 小茜)
姚永刚
研究员,博士生导师。1975年10月生于安徽省枞阳县。1997年毕业于安徽师范大学生物系获学士学位,2003年于中国科学院昆明动物研究所获得理学博士学位,同年2月后赴约翰霍普金斯大学医学院 (The Johns Hopkins University School of Medicine) 从事博士后研究工作,2004年10月转至美国国家健康研究院心脏、肺、血液研究所(National Heart, Lung, and Blood Institute, National Institutes of Health)学习和工作,2007年12月通过中国科学院“****”引进回昆明动物研究所工作。现为疾病机理遗传学和进化医学实验室负责人。
研究方向:
主要从事人类和家养动物相关疾病的研究工作,对mtDNA疾病的进化医学、中华民族源流和家养动物的起源、血液干细胞mtDNA变异和衰老的关系、VEGF刺激血管内皮细胞及其在皮肤细胞中的表达有较为深入的研究。首次系统地分析了我国民族人群mtDNA遗传多态情况,构建了东亚人群mtDNA的系统发育关系,讨论了分子人类学和mtDNA进化医学中多个重要问题。首次发现国人Leber氏遗传性视神经病变发病受到线粒体遗传背景的影响,该成果被Nature China列为2008年12月份的研究亮点。采用单细胞分析方法,研究了白血病细胞和自然衰老过程中小鼠血液干细胞mtDNA的变异情况,发现白血病细胞mtDNA变异很大,产生机制复杂,作为临床诊断标记作用有限;小鼠血液干细胞在衰老过程中积累的mtDNA突变有品系差异,受核基因影响,与其体外发育潜能以及细胞中活性氧水平没有相关性。血液干细胞中某些mtDNA突变在体内比较稳定,可作为标记示踪移植过程中干细胞的动态。发现VEGF刺激血管内皮细胞DSCR1和 PlGF基因表达通过不同的调控途径。近年来已在American Journal of Human Genetics,Blood,Human Molecular Genetics,PLoS Medicine,Human Mutation,Journal of Medical Genetics,Molecular Biology and Evolution,Human Genetics 和Genome Biology等国内外著名期刊发表论文和评述69篇,其中SCI论文61篇。截止2008年12月份被SCI引用1100多次,具有较为广泛的国际影响。博士论文获得2005年度全国百篇优秀博士论文,研究工作先后获得2005年度云南省科学技术奖一等奖(自然科学类)和2006年度国家自然科学奖二等奖等多项奖项。先后受邀为20多个SCI期刊包括American Journal of Human Genetics, Human Mutation, Journal of Medical Genetics, Stem Cells, Nucleic Acids Research等国际著名杂志审稿。
学科组长期的研究工作目标是对于一些重要的与代谢、衰老和肿瘤等有关的疾病或器官功能障碍进行线粒体基因组和核基因突变研究,并从细胞和分子层次进行功能实验,阐述其中机理,为疾病的防治和遗传咨询提供依据和指导。
承担科研项目:
1)Leber氏遗传性视神经病变的诱发因子与发病机制研究
2)线粒体突变和遗传背景在重要退行性疾病发生过程中的作用
3)线粒体与端粒、端粒酶的相互作用对细胞衰老和凋亡的影响
4)信号传导途径基因体细胞突变在肿瘤发生过程中的作用
5)重要家养动物肉质和抗病基因研究
专家类别:
****;研究员
获奖及荣誉:
2006年 国家自然科学奖二等奖:“线粒体基因组多样性与东亚人群历史的研究” (张亚平、姚永刚、孔庆鹏、丁远春、孙昌)
2005年 云南省科学技术奖(自然科学类)一等奖:“线粒体基因组多样性与东亚人群历史的研究”(张亚平、姚永刚、孔庆鹏、丁远春、孙昌)
2005年 全国百篇优秀博士论文
2004年 中国科学院研究生院优秀博士论文
2004年 云南省科学技术奖三等奖(科学技术进步类):“ß2肾上腺素受体遗传多态性与哮喘关系研究”(戴路明、张亚平、陆信、姚永刚、杨敏、张剑青、方利洲)
2003年 云南省科学技术奖三等奖(科学技术进步类):“云南汉族系统性红斑狼疮与补体C4、C2基因相关性研究”(李学平、张亚平、满孝勇、姚永刚、冒长峙、罗怀容、郑经芬)
2002年 中国科学院院长奖特别奖
2001年 德意志学术交流中心短期奖学金
2000年 中国科学院地奥奖学金和院长奖学金优秀奖
下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究
10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!
知名企业招聘
今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号