研究提出警告:群体遗传学中最常见的分析方法存在严重缺陷

【字体: 时间:2022年09月01日 来源:Scientific Reports

编辑推荐:

  瑞典隆德大学(Lund University)的一项新研究显示,群体遗传学中最常见的分析方法存在严重缺陷。这可能导致了不正确的结果和对种族和基因关系的误解。该方法已被用于数十万项研究,影响了医学遗传学甚至商业祖先测试的结果。这项研究发表在《科学报告》上。

  

瑞典隆德大学(Lund University)的一项新研究显示,群体遗传学中最常见的分析方法存在严重缺陷。这可能导致了不正确的结果和对种族和基因关系的误解。该方法已被用于数十万项研究,影响了医学遗传学甚至商业祖先测试的结果。这项研究发表在科学报告

科学数据收集的速度呈指数级增长,导致了大规模且高度复杂的数据集,被称为“大数据革命”。为了使这些数据更易于管理,研究人员使用统计方法,旨在压缩和简化数据,同时仍然保留大部分关键信息。也许最广泛使用的方法是主成分分析(PCA)。通过类比,可以将PCA看作是一个用面粉、糖和鸡蛋作为数据输入的烤箱。烤箱可能总是做同样的事情,但最终做出的蛋糕,关键取决于配料的比例以及它们如何组合。

“由于这种方法使用得如此频繁,预计它将给出正确的结果。但它既不能保证可靠性,也不能产生统计上可靠的结论,”隆德大学分子细胞生物学副教授Eran Elhaik博士说。

根据埃尔海克的说法,这种方法有助于创造关于种族和民族的旧观念。它在制造关于人们来自何方的历史故事中扮演着重要角色,不仅是科学界,还有商业祖先公司。一个著名的例子是,一位著名的美国政治家在2020年总统竞选之前进行了祖先测试,以支持他们的祖先说法。另一个例子是由PCA结果导致的对德系犹太人作为一个种族或一个孤立群体的误解。

“这项研究证明那些结果是不可靠的,”Eran Elhaik说。

PCA在许多科学领域都有应用,但Elhaik的研究主要集中在种群遗传学中,该领域数据集规模的爆发尤其剧烈,这是由DNA测序成本的降低驱动的。

在古基因组学领域,我们希望了解古代的民族和个人,如铜时代的欧洲人,严重依赖于PCA。PCA用于创建一个基因图谱,将未知样本与已知参考样本放在一起。到目前为止,这些未知样本被假定与它们重叠或在地图上最接近的参考种群有关。

然而,埃尔海克发现,只要改变参考样本的数量和类型,就可以使未知样本接近几乎任何参考群体,从而产生几乎无穷无尽的历史版本,所有这些版本在数学上都是“正确的”,但只有一种可能在生物学上是正确的。

文章标题

Principal Component Analyses (PCA)-based findings in population genetic studies are highly biased and must be reevaluated


相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号