为什么GPT不能像我们一样思考

【字体: 时间:2025年02月25日 来源:AAAS

编辑推荐:

  人工智能(AI),特别是像GPT-4这样的大型语言模型,在推理任务中表现出了令人印象深刻的表现。但人工智能真的能理解抽象概念,还是只是模仿模式?阿姆斯特丹大学和圣菲研究所的一项新研究表明,虽然GPT模型在一些类比任务上表现良好,但当问题被改变时,它们就会出现不足,这凸显了人工智能推理能力的关键弱点。

  

人工智能(AI),尤其是像GPT-4这样的大型语言模型,在推理任务上表现出了令人印象深刻的性能。但AI是否真正理解抽象概念,还是仅仅在模仿模式?阿姆斯特丹大学和圣塔菲研究所的一项新研究表明,尽管GPT模型在某些类比任务上表现良好,但当问题被改变时,它们的表现就会下降,这突显了AI推理能力的关键弱点。

类比推理是通过比较两个不同事物在某些方面的相似性来得出结论的能力。这是人类理解世界和做决策的最常见方法之一。例如:杯子之于咖啡,就像汤之于什么?(答案是:碗)。

像GPT-4这样的大型语言模型在各种测试中表现出色,包括需要类比推理的测试。但AI模型是否能够真正进行一般性的、稳健的推理,还是过度依赖于训练数据中的模式?语言和AI专家、阿姆斯特丹大学逻辑、语言与计算研究所的玛莎·刘易斯(Martha Lewis)和圣塔菲研究所的梅兰妮·米切尔(Melanie Mitchell)进行的这项研究,考察了GPT模型在进行类比时是否像人类一样灵活和稳健。“这一点至关重要,因为AI越来越多地被用于现实世界中的决策和问题解决。”刘易斯解释道。

刘易斯和米切尔将人类和GPT模型的表现进行了比较,测试了三种不同类型的类比问题:

  1. 字母序列——识别字母序列中的模式并正确完成它们。

  2. 数字矩阵——分析数字模式并确定缺失的数字。

  3. 故事类比——理解哪两个故事与给定的例子故事最匹配。

一个真正理解类比的系统,即使在问题发生变化时,也应该保持较高的表现。除了测试GPT模型是否能解决原始问题外,研究还考察了它们在问题被微妙修改后表现如何。“一个真正理解类比的系统,即使在这些问题发生变化时,也应该保持较高的表现。”作者在他们的文章中这样写道。

GPT模型在稳健性方面存在困难。人类在大多数修改后的问题版本上都保持了较高的表现,但GPT模型虽然在标准类比问题上表现良好,但在面对变化时却显得吃力。“这表明AI模型的推理通常不如人类灵活,它们的推理更多依赖于模式匹配,而不是真正的抽象理解。”刘易斯解释道。

在数字矩阵中,当缺失数字的位置发生变化时,GPT模型的表现显著下降。而人类则没有这种困难。在故事类比中,GPT-4倾向于选择第一个给出的答案为正确答案,而人类则不受答案顺序的影响。此外,当故事的关键元素被重新措辞时,GPT-4比人类更难应对,这表明它依赖于表面相似性,而不是更深层次的因果推理。

在简单的类比任务中,当测试修改后的版本时,GPT模型的表现有所下降,而人类则保持一致。然而,在更复杂的类比推理任务中,人类和AI都面临挑战。

这项研究挑战了人们普遍认为像GPT-4这样的AI模型能够像人类一样推理的假设。“尽管AI模型展示了令人印象深刻的能力,但这并不意味着它们真正理解它们在做什么。”刘易斯和米切尔总结道。“它们在跨变化泛化的能力上仍然明显弱于人类认知。GPT模型往往依赖于表面模式,而不是深度理解。”

这是对在教育、法律和医疗保健等重要决策领域使用AI的一个重要警告。AI可以是一个强大的工具,但它还不是人类思维和推理的替代品。

涓嬭浇瀹夋嵎浼︾數瀛愪功銆婇€氳繃缁嗚優浠h阿鎻ず鏂扮殑鑽墿闈剁偣銆嬫帰绱㈠浣曢€氳繃浠h阿鍒嗘瀽淇冭繘鎮ㄧ殑鑽墿鍙戠幇鐮旂┒

10x Genomics鏂板搧Visium HD 寮€鍚崟缁嗚優鍒嗚鲸鐜囩殑鍏ㄨ浆褰曠粍绌洪棿鍒嗘瀽锛�

娆㈣繋涓嬭浇Twist銆婁笉鏂彉鍖栫殑CRISPR绛涢€夋牸灞€銆嬬數瀛愪功

鍗曠粏鑳炴祴搴忓叆闂ㄥぇ璁插爞 - 娣卞叆浜嗚В浠庣涓€涓崟缁嗚優瀹為獙璁捐鍒版暟鎹川鎺т笌鍙鍖栬В鏋�

涓嬭浇銆婄粏鑳炲唴铔嬬櫧璐ㄤ簰浣滃垎鏋愭柟娉曠數瀛愪功銆�

相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普
    • 急聘职位
    • 高薪职位

    知名企业招聘

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号