基因芯片相关生物信息学进展

【字体: 时间:2001年04月14日 来源:

编辑推荐:

  

  

新生命网站全国首届生物信息学大会报道:基因芯片又称寡核苷酸芯片或DNA芯片,通过把大量的DNA片断以可寻址的方式,高密度地固定到一块指甲大小的玻璃片或硅片上,利用核酸碱基之间的配对,用来进行样品DNA高通量、并行的分析信息的工具。随着国际大规模的基因测序计划的爆炸性发展,人们已经把目光从单纯的测序转向进行基因功能研究的后基因组时代。面对浩如烟海的序列信息,DNA芯片以其并行、高通量的特点当之无愧的成为后基因组时代的首要研究工具。由于基因芯片的高集成性,每一次芯片实验都要产生巨大的信息量。以平均每片5000个点,每个实验设4个水平,每个水平重复3次计算,则一次完整的实验将产生6万个数据。如此大量的数据如何进行存储、分析,是提交给研究人员的一个巨大挑战。

为了定位和跟踪物理资源(例如,克隆子,阵列或探针),计算机系统在实验前后都必须存储大量的数据。建立芯片数据库是使数据在一定范围内最有效的共享和分配最好的途径。虽然,当今大量的序列、结构数据库为生物芯片数据库的建立提供了一个较好模式,但生物芯片的数据仍有其特有的性质,给建立一个通用的、有效的、可以和别的数据库交换数据的数据库带来很大的麻烦,必须发展新的数据库模式。例如,芯片杂交结果的扫描图片,芯片数据的描述,不同平台之间的结果比较等等。

目前世界上主要的芯片数据库有:美国基因组研究中心(NCGR)的GeneX,欧洲生物信息研究所(EBI)的ArrayExpress,美国生物技术信息国家中心(NCBI)的GEO(gene expression omnibus),MIT的ChipDB,Harvard的ExpressDB,宾州大学的EPODB,加州大学San Francisco分校的AMAD等。

现在用来分析生物芯片数据的算法还不多,已经发展得比较成熟的算法是聚类分析(cluster),包括自组织图(SOM),k-means cluster,多维排列(multi-dimensional scaling,MDS)等等。另外还有主成分分析(PCA),Support Vector Machines(SVM),隐式马尔可夫模型(HMM)等。

生物芯片的分析软件主要有Stanford大学开放源代码、免费的一系列软件:用来分析芯片图象的ScanAyze,和数据处理和可视化的Cluster,TreeView。另外MIT的Whitehead实验室的GeneCluster是一个基于自组织图算法的一个分析软件。商用软件有Spotfire公司的GeneSpring和Partek公司的Partek Pro 2000。这些商用软件可选择的算法比较多,而且可视化工作做得很好,用户界面友好。但无论是学术的还是商业的,至今还没有一个集成芯片制造,图象处理,数据归一化处理,数据分析为一体的软件套。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热搜:|

  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号