研究发现，大多数人工智能都难以读取时钟和日历

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年03月17日 来源：AAAS

编辑推荐：

　　一项研究表明，世界上一些最先进的人工智能系统很难在日历上显示时间和日期。

10x Genomics推出高分辨率的Visium HD空间基因表达分析技术，欢迎询价/索取资料

为了促进科学的传播，生物通采集了这篇文章，订阅Biohot解锁原文索取

一项研究表明，世界上最先进的某些人工智能系统在读取时间和解读日历日期方面存在困难。尽管人工智能模型能够执行诸如撰写文章和生成艺术作品等复杂任务，但研究人员表示，它们尚未掌握人类轻松完成的一些技能。

爱丁堡大学的一个团队表明，最先进的AI模型无法可靠地解释时钟指针的位置或正确回答有关日历日期的问题。与简单识别形状不同，理解模拟时钟和日历需要结合空间意识、上下文和基本数学知识——这对AI来说仍然是一个挑战。

欢迎领取10x Genomic的Chromium单细胞免疫分析技术方案，了解如何以单细胞分辨率、从多组学角度探索免疫细胞的复杂多样性领取

研究人员表示，克服这一挑战将使AI系统能够为时间敏感型应用提供支持，例如日程安排助手、自主机器人以及为视障人士设计的工具。该团队测试了处理文本和图像的AI系统——即多模态大语言模型（MLLMs），看看它们是否能够通过查看时钟或日历的图片来回答与时间相关的问题。研究人员测试了各种时钟设计，包括带有罗马数字的、有无秒针的以及不同颜色表盘的时钟。

研究结果显示，AI系统在最佳情况下，正确判断时钟指针位置的次数不到四分之一。当指针为罗马数字或指针设计独特时，错误更为常见。即使移除秒针，AI系统的性能也没有提高，这表明在指针检测和角度解释方面存在深层次问题。研究人员还让AI模型回答一系列基于日历的问题，例如识别假期以及计算过去和未来的日期。

研究团队发现，即使是表现最好的AI模型，也有五分之一的时间会算错日期。这些研究结果将发表在一篇经过同行评审的论文中，并将于2025年4月28日在新加坡举行的第十三届国际学习表征会议（ICLR）上的“大语言模型的推理与规划”研讨会上进行展示。

广告【大小鼠常见临床症状】最新指南一键下载

爱丁堡大学信息学院的罗希特·萨克纳（Rohit Saxena）领导了这项研究，他说：“大多数人从小就能看时间和使用日历。我们的研究结果突显了AI在执行人类相当基本的技能方面存在显著差距。如果要将AI系统成功整合到时间敏感型的实际应用中，例如日程安排、自动化和辅助技术，这些不足之处必须得到解决。”

爱丁堡大学信息学院的阿罗·杰玛（Aryo Gema）表示：“如今的人工智能研究往往强调复杂的推理任务，但讽刺的是，许多系统在处理更简单的日常任务时仍会遇到困难。我们的研究结果表明，是时候解决这些基本差距了。否则，将AI整合到实际的时间敏感型应用中可能会一直停滞不前。”

下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究

10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析！

欢迎下载Twist《不断变化的CRISPR筛选格局》电子书

单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析

下载《细胞内蛋白质互作分析方法电子书》