-
生物通官微
陪你抓住生命科技
跳动的脉搏
中科院、复旦大学《Cell research》文章
【字体: 大 中 小 】 时间:2011年09月15日 来源:生物通
编辑推荐:
近日来自中科院上海生科院生化与细胞所和复旦大学生命科学学院的研究人员以《Cell Research》期刊上发表了题为“A network-based gene-weighting approach for pathway analysis”的研究论文,报道了合作完成的生物学通路分析方法上的最新研究成果。
生物通报道 近日来自中科院上海生科院生化与细胞所和复旦大学生命科学学院的研究人员以《Cell Research》期刊上发表了题为“A network-based gene-weighting approach for pathway analysis”的研究论文,报道了合作完成的生物学通路分析方法上的最新研究成果。
中科院上海生科院生化与细胞所季红斌研究员和复旦大学生命科学学院田卫东教授为这篇文章的共同通讯作者。主要工作由博士生方兆元在两位导师的共同指导下完成。该课题得到了国家科技部973课题、国家自然科学基金委、中科院以及上海市科委的经费支持。
近年来生物信息学被广泛应用到基因组学研究中,探索生命起源、生物进化的基本规律,探索细胞、器官和个体的发生、发育、死亡等生命科学中的重大问题。在此过程中,科学家们也在不断地发展和改良生物信息学分析方法,尤其是基于基因表达谱数据的生物学通路分析方法。
目前研究人员主要利用经典的通路数据库(如KEGG,Biocarta和Gene Ontology等)对基因表达谱数据进行统计学分析,以得到在特定的生物学过程中发生显著变化的通路。在这些方法中,用于分析的生物学通路往往被简化成一系列基因的简单集合,而忽略了特定通路中不同基因之间潜在的功能联系。这种将复杂的生物学通路简化为简单的基因集合的处理对于生物信息学分析方法的建立是非常有利的,但忽略基因之间的功能联系显然不利于更加准确地评估相关通路的改变。
在这篇文章中,研究人员提出在许多生物学通路中,基因之间的相对重要性是不完全均一的,而这种不均一性是“组成型”的。他们通过整合蛋白质相互作用数据,基因共表达数据,以及Gene Ontology通路的数据库,构建了一个全基因组水平的基因功能关联网络,并设计了一个度量生物学通路中基因相对重要性的方法。通过对一些已知的生物学通路进行测试的结果表明,该方法计算得到的基因权重和生物学认识是相符的;同一个基因在不同的生物学通路的权重可以不同,因此这些权重是生物学通路特异的;对基因网络的随机干扰试验表明,该方法得到的权重可以对抗相当程度的网络干扰,因而是稳定的。这些权重实际上可以和许多以前发展出来的算法相结合,产生带有基因加权的算法。在该工作中,以两种算法(MeanAbs和GSEA)为例得到了相应的加权版本。通过一系列测试数据表明,对于包含重要性有差异的基因或者基因亚群的生物学通路,加权算法能够更好地检验这些生物学通路的显著性。
在生物学通路分析中另外一个常常被忽视的问题是,一些通路也包含多亚基(multiple-subunit)蛋白质,按基因命名惯例, 每一个亚基都有一个单独的编码基因,相应的结果是,这些信号通路中的多亚基蛋白相对于单个基因编码的蛋白来说,权重被高估了。在该工作中,研究人员通过将多亚基蛋白质作为信号通路的单一组成单位来纠正这种偏差。改良后的方法在三个独立的乳腺癌基因表达谱数据中的测试结果表明,加权算法找出来的生物学通路具有更好的可重复性。这一工作表明加权算法将有助于在生物学通路水平上更好地研究基因表达谱数据,为该课题组目前正在进行的肺癌基因组学研究奠定了坚实的基础。
尽管过去的研究已经建立了诸多的生物信息学方法,如何更加准确地利用基因表达谱数据来寻找特定生物学过程中的通路改变仍然是一个有待解决的难题。该工作通过建立基因功能相关网络并利用其给生物学通路内部的不同基因加权,是基因表达谱数据生物学通路分析的崭新尝试。
生物通推荐原文摘要:
A network-based gene-weighting approach for pathway analysis
Classical algorithms aiming at identifying biological pathways significantly related to studying conditions frequently reduced pathways to gene sets, with an obvious ignorance of the constitutive non-equivalence of various genes within a defined pathway. We here designed a network-based method to determine such non-equivalence in terms of gene weights. The gene weights determined are biologically consistent and robust to network perturbations. By integrating the gene weights into the classical gene set analysis, with a subsequent correction for the “over-counting” bias associated with multi-subunit proteins, we have developed a novel gene-weighed pathway analysis approach, as implemented in an R package called “Gene Associaqtion Network-based Pathway Analysis” (GANPA). Through analysis of several microarray datasets, including the p53 dataset, asthma dataset and three breast cancer datasets, we demonstrated that our approach is biologically reliable and reproducible, and therefore helpful for microarray
作者简介:
季红斌
研究员,研究组长,博士生导师
个人简介:
2007年至今:中国科学院上海生命科学研究院生物化学与细胞生物学研究所,研究员,研究组长
2004-2007年:美国哈佛医学院Dana-Farber Cancer Institute,先后为博士后,Instructor
2000-2004年:美国哈佛医学院Beth Israel Deaconess Medical Center,博士后
1995-2000年:中国科学院上海生物化学研究所,生物化学与分子生物学,博士
1991-1995年:吉林大学生化系,学士
研究方向:肺癌发病的分子机理
研究工作:
人类肺癌相关基因的遗传学改变
人类肺癌的动物模型
肺癌的转移
此外,课题组的研究兴趣还包括以下几方面:1)寻找和鉴定可用于肺癌早期诊断的血清生物标记;2)研究miRNA在肺癌发生发展过程中潜在的功能和机制;3)研究在肺癌发生发展过程中起关键作用的代谢相关基因。
田卫东
复旦大学生科院生物统计研究所,教授,博士生导师
教育背景
2005-2008 美国哈佛大学医学院 博士后 生物信息学
1998-2004 美国华盛顿大学(圣路易斯) 博士 生物信息学
1995-1998 清华大学 硕士 应用微生物
1991-1995 上海交通大学
奖励和荣誉
2007 中国教育部春晖计划
2006-2007 美国国家健康卫生研究院(NIH)Roadmap Fellowship
2002 International Conference on Intelligent System for Molecular Biology(ISMB))Travel Fellowship, Edmonton, 加拿大
1998-2004 孟山都公司/华盛顿大学联合奖学金,华盛顿大学(圣路易斯), 美国
1997 丹麦诺和诺德公司生物科技奖,清华大学
1992 人民奖学金,上海交通大学
研究兴趣和经历
主要研究兴趣包括:基因(蛋白)功能预测、大规模组学数据整合、功能连锁网络构建和生物网络分析、疾病基因和基因模块预测、代谢网络重建和模拟,及基于新测序技术的小片断DNA序列的组装和基因剪切亚型(splicing isoform)鉴定及剪切机制对蛋白质功能和生物网络的影响的算法开发和应用。
主要研究经历包括:(1)开发了一基于新测序手段(454 sequencing technology) 自动组装mRNA小片断序列并鉴定基因剪切亚型的新算法,并和实验工作结合发表于Nature Methods(共同第一作者)。(2)开发了整合基因组学、蛋白质组学、转录组学等大规模信息资源来预测蛋白功能的概率模型及二次数据库。应用此一模型对酵母和小鼠全基因组基因功能(Gene Ontology)预测。其中,对酵母基因的预测结果已被酵母研究领域的权威数据库- Saccharomyces Genome Database(SGD)收录及引用。在参与小鼠全基因组基因功能预测评估的9个世界知名实验团队中,以基因功能预测的准确性领先于其他算法。此一模型还被应用于小鼠全基因组基因表型的预测。(3)系统地研究了酶功能和蛋白序列同源性的定量关系,开发了一精确预测酶功能的生物信息学工具,对包括模式动植物在内的245个基因组进行了全基因组的酶功能预测. 其中一篇研究成果被选入“Faculty of 1000 Biology”。酶系列研究成果至今已被包括“Nature Review Molecular Cell Biology”在内的90几篇文章引用。
下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究
10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!
知名企业招聘
今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号