-
生物通官微
陪你抓住生命科技
跳动的脉搏
研究人员通过人工智能消除了干扰,提高了足球直播的质量
【字体: 大 中 小 】 时间:2024年07月12日 来源:AAAS
编辑推荐:
虽然体育产业不断改善观众在家观看的体验,但仍有一些问题尚未解决。对足球迷来说,这样的一个问题是,在直播中,摄影师们意外地出现在彼此的镜头中。这些事件不仅影响了比赛的关键时刻,而且由于观众的不满,可能会导致转播商的收入损失。为了解决这个问题,考纳斯理工大学(KTU)的研究人员开发了一种端到端系统,通过消除重叠摄像机角度造成的视觉干扰来增强观看体验。
虽然体育产业不断改善观众在家观看的体验,但仍有一些问题尚未解决。对足球迷来说,这样的一个问题是,在直播中,摄影师们意外地出现在彼此的镜头中。这些事件不仅影响了比赛的关键时刻,而且由于观众的不满,可能会导致转播商的收入损失。为了解决这个问题,考纳斯理工大学(KTU)的研究人员开发了一种端到端系统,通过消除重叠摄像机角度造成的视觉干扰来增强观看体验。
“我们的新发明是一种用于检测视频操作员的算法,”KTU教授Rytis Maskeliūnas说,他是这项创新的创造者之一。
研究小组的另一名成员Serhii Postupaiev强调,由于体育直播的复杂性和体育场周围众多的摄像机,镜头中出现摄影师是足球转播中经常出现的问题。
“在著名的锦标赛中,摄像点的数量可以从9个开始,并且许多重叠的视图会导致视觉分散问题。这些问题严重限制了摄像团队,因为他们必须不断地拍摄游戏,同时避免捕捉对方,这可能会导致某些游戏时刻失去背景,或者使广播缺乏活力和沉浸感,”Postupaiev解释道。
消除视觉干扰
为了解决这个问题,并在直播过程中移除不需要的物体,KTU的科学家设计并实现了一个端到端系统。
它的功能,YOLOv8模型,一个最先进的物体检测系统,以其速度和准确性而闻名。YOLOv8代表“你只看一次”,可以在一次通过中检测和分类图像中的物体,使其成为实时事件(如足球直播)的理想选择。
“它的工作原理是将图像分成一个网格,并预测每个网格单元的边界框、分类概率和分割多边形。这使它能够识别和分割摄影师,”最近从KTU毕业并获得计算机科学人工智能硕士学位的Serhii Postupaiev说。
为了训练YOLOv8模型在足球比赛中准确地检测和分割摄影师,必须创建一个数据集。
“我创建了这个数据集,包括各种不同尺寸,形状和设备类型的摄影师,在不同条件下和游戏的不同阶段拍摄。现在YOLOv8使用这个数据集来识别摄影师在视频帧中的位置,”Postupaiev补充道。
正如发明者所解释的那样,这个过程需要为实际移除操作人员奠定基础。为此,使用了视频绘画技术。
“在深度学习中,重新绘制是指重建图像和视频中丢失或恶化部分的过程。具体来说,在这种情况下,它被用于从足球视频广播中移除摄影师,”Postupaiev说。
人工智能(AI)和基于计算机视觉的技术分析视频帧,以检测不需要的物体,如摄影师,并用相关的背景细节填充被删除的区域。然后将修改后的帧流传回给观众,确保更加身临其境和专业的广播。
Maskeliūnas补充说,在电视服务器上,这种算法可以在播出之前处理录制的图像,从实际捕获的时刻开始延迟几秒钟,这仍然被认为是直播。他认为,随着设备的改进,人工智能将完美地填补这段时间的空白。
将注意力从简单的捕捉动作转移
有了这项新技术,在家观看足球比赛将得到显著改善。其中之一是更流畅的观看体验。
“如果没有摄像师出现在不该出现的地方,直播会让人感觉更精致、更专业。这一改进将减少由于分散注意力的射门而错过比赛重要时刻的情况,”Postupaiev强调说,他通过这个项目获得了硕士学位。
根据Postupaiev的说法,这一领域的进一步研究可能会迎来体育转播的新时代,将焦点从简单地捕捉动作转移到创造完全沉浸式和不间断的观看体验。
他表示:“通过在绘画中加入摄影师,广播公司可以探索创新的摄像角度、视角和效果,以新的、令人兴奋的方式将游戏带入生活。”
此外,摄影师可以扩展到现场直播之外,以增强赛前和赛后分析,离线集锦处理和档案录像的恢复。
一位KTU毕业生补充说:“这甚至可以为经典比赛的旧录音注入新的活力。”
发明并不局限于足球,它可以应用于其他有类似广播挑战的运动。五人制足球和篮球等需要沉浸式转播的动态运动也可以从这项技术中受益。
“这是现代人工智能应用可以做什么的又一个例证。我们经常听说医疗应用,但在这里,我们有一个面向消费者的方法来编辑我们不喜欢的图像。KTU信息学教授Maskeliūnas说:“将来,这种技术将能够,例如,删除广告或用其他广告代替它们,从而以人眼不会注意到的精度不断更新内容。”