生物信息学的过去、现在和将来

【字体: 时间:2002年01月14日 来源:

编辑推荐:

  

  

--李亦学博士访谈

李亦学博士:现任中科院上海生命科学研究院生物信息中心副主任

记:听说您是我国比较早的从事生物信息学的专家之一,能否请问生物信息学是怎样起源的?

李:我不是最早的,生物物理所的陈润生,这边生化所的丁达夫先生、还有一些,如内蒙古大学的罗辽夫先生、天津大学的张春霆先生,他们都做得比较早

我去年6月才从德国回来着手这方面的工作,国外我也做一些生物信息学方面的工作。

生物信息对生物科学所产生的大量的数据进行分析和管理的学科,主要内容包括数据管理和挖掘,是一种交叉学科,即生物学、计算机科学、信息科学、数学、物理学等学科结合的交叉学科,重点是数据管理和数据挖掘。数据是生物学数据,原来主要是核酸、蛋白质序列的信息,数据量不断增长,HGP计划的实施与接近完成,造成生物信息呈指数性增长,使得挖掘数据的生物学含义变得紧迫重要,因此生物信息学有了很大的发展。

1989年有人(马来西亚华人在美国工作)先提出Bioinformatics这个词,然后这个概念逐渐被接受。该学科1995年经历了里程碑式的发展,就在那一年,第一个细菌的全基因组序列--流血嗜血杆菌全基因组测定,并在Science上发表。人类第一次有了一个物种完整的全基因组信息。从那年起,人类可以面对比较大的整个基因组。现在,人类拥有几百种物种的基因组序列信息,包括质粒、原核生物、真核生物、水稻、果蝇等。人类掌握的数据不断增加,分析需求变得越来越紧迫。

除了信息量的变化以外,人们进行生物信息学分析的本质也起了变化,那就是人们处理数据的类型也发生了变化。比如现在进行的基因芯片表达谱数据分析,目标是找出基因功能,分析基因调控网络情况等。所处理的数据与原来的序列数据相比,两者是完全不同的。

目前还有蛋白质组信息,包括质谱数据,目标也是找出蛋白质的功能信息等

原先生物信息学的研究范围较狭窄,仅包括核酸序列和蛋白序列的分析和相应数据管理。对数据进行分析整理后,得出结果,网上公布,供参考、搜索、并发展了一些算法,寻找Promition(启动区),ORF(开放阅读框) 预测,序列结构挖掘等。

现在生物信息学则囊括了计算生物学,比如生物大分子结构的动态模拟、计算,细胞内生理过程的模拟,甚至虚拟人体等等,凡是与生命过程相关的信息,都是生物信息学研究的对象。

记:现在是否朝着功能基因组学的方向发展?

李:这个过成是分几个阶段来实现的。最早人们注重序列结构分析,尤其是模式生物基因组。目前对人类基因组已经拿到了90%以上的完整序列信息,仅剩下一些gap需要填空。然后人们发现进一步的工作是了解功能。原来是基因组时代,现在是功能基因组时代。生物信息学包括基因组和功能基因组信息分析。现在更重视功能基因组的研究。就拿表达谱基因芯片来说,芯片的发展应该与生物信息学紧密结合,数据分析处理需要生物信息学大展身手。两者绝对不能脱钩。现在应通过生物信息学来设计基因芯片实验,达到准确、正确分析的目的。

记:世界主要三大数据库,NCBI, DDBJ, EMBL都在国外, 这对于我国的生物信息学发展有没有什么影响?

李:这三大数据库建立时间都比较早,分别位于美国、欧洲和日本。全球各地可以通过网络与之相连,可以下载数据,也可以将其本地化(local)。对中国用户来说,网络堵车是最大的问题,拥挤的网络,速度慢,查询不方便。其次,研究者对数据库的要求不仅是查询某个序列,而是"求全责备",希望能在一个数据库中拿到所有的相关信息。然而现在的数据库,信息分散,根据存储对象不同,各自侧重点也不同,信息整合存在困难。现在的数据库大都是免费的,也有受费的,如果以后一些重要的数据库收费了,那将会给用户造成很大的障碍。

记:有时进行序列查询,发现自己输入的好像是新的,但是后来申请专利时却发现已经被别人抢注了。能不能就此认为数据库不可靠呢?

李:以前曾经发生过这样一件事情,某个研究机构发现一条基因,与乳腺癌的发病有关。于是着手研究。可是,某家商业公司却把这家研究机构告上了法庭,因为这条基因的相关专利已经被该公司注册了。因为某些大药厂、私人研究机构也进行测序的工作,有机会发现新序列,就直接申请专利了;有些尽管已经提交序列,但申请hold一年,一年后才能公开。所以,数据库中的查询结果并不一定完全可靠,专利数据库的查询也很重要。

记:我们国家的生物信息学发展状况怎么样?

李:从上到下,我国给与生物信息学的发展以高度重视,各方面都很有积极性,因此发展较快。2000年4月,在北京召开了中国第一届生物信息学大会,其盛况空前。与会人员所作的报告,其内容涉及生物信息学的各个方面。所以说,目前中国的生物信息学的布局已经与世界接轨了。但是就具体内容而言,深入程度还是有所差距。具体体现在:1. 目前尚无中国开发的知名生物信息学软件;2. 信息共享方面还不够。总而言之,中国的生物信息学发展状况是起步早,有些比较出色的工作,但整体水平有待提高。

具体而言,比如陈润生先生收集整理的est数据库,商业价值很高;丁达夫先生专攻蛋白质设计,分析野生型蛋白质,重新设计定点突变,改变蛋白质活性;郝伯林先生原来专攻理论物理,他从基因组水平上研究进化,发展了新的算法,得出了非常好的结果。 记:生物信息学的发展需要什么样的人才?

李:生物信息学是一门交叉学科,它所需要的人才应该是多学科交叉的,包括生物学、计算机、信息、物理、数学等,学科应该交叉和有机融合,这样才能推动学科的发展。

记:除了生物芯片的实验设计之外,生物信息学还有什么热点?

李:国家的863计划中,提到了生物信息学技术的有关工作。5年计划内提到的重点发展方向是生物信息的获取和开发;生物信息的加工和利用,包括挖掘数据、开发软件等等。目前的攻关方向是基因研究和相关信息分析、功能基因组信息分析等。 记:国家对生物信息学发展有什么期望?

李:首先是实现生物信息的数据共享,国内或科研单位数据共享。其次是生物学数据挖掘方法研究,分析软件的开发,最后是一些技术的产业化,如商业软件、资源数据库等等。其他还有对数据进行分析,满足用户需要。

有一点需要指出,我个人认为生物信息学目前主要应该是一种生物学研究的技术支撑手段,而不能局限于基础理论研究。生物信息学与生物学的关系是紧密结合的,就好像皮毛关系一样。

记:能否请您介绍一下中心的情况?

我们中心成立于2000年3月,2001年7月3日起正式运作。目前中心的雇员,包括full-time和part-time的,共有30多人。目前从事的主要工作是为生科院实验室、上海市周边地区的科研单位提供服务,包括数据库服务、生物信息学软件的开发、人员培训、软件的整理、整合等等。有时还与有关机构合作,承接项目,进行研究服务。目前中心与欧洲的EMBL有合作关系,其他合作单位还有法国国家基因组研究中心、EBI欧洲分子生物学中心,日本的DDBJ等。

中华基因网专访

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热搜:生物信息学|

  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号