生物信息软件集成和开发

【字体: 时间:2001年04月16日 来源:

编辑推荐:

  

  

新生命网站全国首届生物信息学大会报道:随着生物信息学在生命科学和生物技术研究开发中发挥出日益重要的作用,生物信息学常用软件已经成了生物学工作者必备工具。许多国际著名生物信息中心通过计算机网络提供数据库检索和数据库搜索等服务。1997年以来,在国内有关部门和欧洲分子生物学网络组织的支持和帮助下,以教育科研华北地区主节点为支撑,北京大学生物信息中心逐步建立了一套比较完备的生物信息服务系统,为国内及周边地区的用户提供生物信息学资源和综合服务,并在此基础上进行生物信息软件工具的集成和开发。

他们建立的生物信息资源服务系统基于UNIX平台,包括数据库检索系统SRS、数据库下载服务FTP、以及数据库搜索系统BLAST。这三个系统相互联系,是分子生物学数据库应用的主要组成部分。为保证国内用户及时使用最新的数据资源,首先必须解决数据同步更新的问题。对于最常用并且数据量最大的核酸序列数据库EMBL和蛋白质三级结构数据库PDB,做到每日更新;蛋白质序列数据库SWISSPROT和TREMBL每周更新。所有更新后的数据随时公布在FTP服务器上,同时对新数据建立SRS索引,然后通过EMBL-FASTA-BLAST一系列格式转换,保证用户能通过BLAST搜索到最新的数据。

尽管目前已经有了许多基于PC机WINDOWS的序列分析软件,但PC机的计算和存储能力无法和基于UNIX系统的大型服务器相比,特别是随着数据库容量的快速增长,大规模的序列比对和数据库搜索必须通过高性能服务器才能实现。为此,他们分别在基于SMP的SUN3500服务器(4个处理器、4GB内存、350GB磁盘空间)和国产曙光2000高性能服务器(4个节点、8个处理器、5GB内存,400GB磁盘阵列)上对分子生物信息软件的开发和集成进行了尝试并获得了初步结果。

他们已开发的基于WWW界面的生物信息软件包括:序列数据格式转换程序、DNA互补序列转换程序、DNA序列碱基组成分析程序、蛋白质氨基酸组成分析程序、DNA序列GC含量分析程序、DNA到蛋白质翻译程序和DNA序列开放阅读架查找程序等。这些程序用Perl编写,通过CGI接口与用户交互,并提供图形结果,便于用户分析使用。并进行了BLAST和FASTA等程序的集成和WWW接口的开发。BLAST是用于DNA和蛋白质序列相似性搜索的重要工具。许多国际著名生物信息中心都提供BLAST服务。他们用Perl编写用户接口和结果优化程序。结果优化包括两个方面,一是提供独特的图形结果,用不同颜色标记匹配区域在检测序列和目标序列上的位置和所占比例,使用户对搜索到的序列与检测序列的相似程度以及相似区域在各自序列中的位置等信息一目了然;二是通过目标序列编号与SRS系统相应数据库链接,用户可以同时得到检测序列和目标序列的详细注释信息。目前,提供BLAST搜索的数据库包括EMBL核酸数据库和SWISSPROT、PIR、OWL以及TREMBL蛋白数据库。该服务器已为国内用户提供了大量数据库搜索服务。同时,他们基于国产曙光高性能计算机,实现了BLAST的并行计算,大大提高了这一数据库搜索工具的运算效率和处理能力,同时也为生物信息学软件的并行化和国产高性能服务器的推广作了有意的尝试。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热搜:|

  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号