谷歌DeepMind推出了首个能与业余选手对战的AI乒乓球机器人,尽管目前尚不敌顶尖选手,但以AlphaGo为例,AI有望在未来迅速赶超人类。随着AI技术不断提升,或许樊振东的下一个强劲对手将是人工智能。
在刚刚结束的2024巴黎奥运会乒乓球男子单打上,中国选手樊振东以卓越的表现夺得了乒乓球男子单打冠军。然而,关于人工智能在乒乓球领域的崛起,AI与人类顶尖选手之间的竞争已经悄然开始。
周三,谷歌DeepMind的研究人员推出了首个能够与业余水平的人类选手一较高下的AI乒乓球机器人。这款系统由ABB IRB 1100工业机器人臂和DeepMind的定制AI软件组成。尽管顶尖人类选手仍可轻松取胜,但该系统展现了机器在需要快速决策和灵活适应的复杂物理任务中的潜力。
研究人员在arXiv上发布的预印本论文中写道:"这是首个能与人类在同等水平上进行体育竞技的机器人代理,它标志着机器人学习和控制技术的一个重要里程碑。"
这款尚未命名的机器人代理(我们建议命名为"AlphaPong"),由David B. D'Ambrosio、Saminda Abeyruwan和Laura Graesser等研究人员开发,在与不同水平的人类选手的一系列比赛中表现出色。在涉及29名参与者的研究中,这款AI机器人赢得了45%的比赛,显示出扎实的业余水平。它在对阵初学者时保持了100%的胜率,在对阵中级选手时胜率为55%,但在面对高级对手时则显得有些力不从心。
该系统的物理设置包括IRB 1100机器人臂,这是一个6自由度的机械臂,安装在两个直线轨道上,可以在2D平面内自由移动。高速摄像机追踪球的位置,动作捕捉系统则监控人类对手的球拍动作。
AI是系统的核心
DeepMind的研究人员开发了一种双层方法,使机器人能够执行特定的乒乓球技巧,并实时调整策略以适应每位对手的打法。换句话说,这款机器人足够灵活,能够与任何业余水平的人类选手进行乒乓球比赛,而无需针对特定选手进行训练。
系统架构结合了低级技能控制器(训练有素的神经网络策略,用于执行正手击球、反手回球或发球等特定乒乓球技巧)和高级战略决策者(一个更复杂的AI系统,它分析比赛状态,适应对手风格,并为每个来球选择激活哪个低级技能策略)。
研究人员指出,该项目的一个关键创新是训练AI模型的方法。他们采用了一种混合方法,结合了模拟物理环境中的强化学习和基于现实世界实例的训练数据。这种技术使机器人能够从大约17,500个现实世界的球道轨迹中学习,对于一项复杂任务来说,这是一个相对较小的数据集。
研究人员通过迭代过程来提升机器人的技能。他们从一小套人类对人类的比赛数据集开始,然后让AI与真实对手对战。每场比赛都产生了关于球道轨迹和人类策略的新数据,这些数据被反馈到模拟中进行进一步训练。经过七个周期的重复,机器人不断适应越来越熟练的对手和多样化的打法。到最后一轮,AI已经从超过14,000个拉球和3,000个发球中学习,积累了丰富的乒乓球知识,帮助它在模拟和现实之间架起了桥梁。
有趣的是,Nvidia也在尝试类似的模拟物理系统,例如Eureka,它允许AI模型在模拟空间中快速学习控制机器人臂,而不是在现实世界中(因为模拟中的物理可以加速,并且可以同时进行数千次试验)。这种方法可能会显著减少训练机器人进行复杂交互所需的时间和资源。
人类喜欢与它对打
除了技术成就外,研究还探讨了与AI对手比赛的人类体验。令人惊讶的是,即使是输给机器人的选手也报告说享受了这种体验。研究人员指出:"在所有技能组和胜率中,选手们一致认为与机器人比赛是'有趣'和'引人入胜'的。"这种积极的反馈表明AI在体育训练和娱乐领域有潜在的应用。
然而,该系统并非没有局限性。它在处理极快或高球时表现不佳,难以读取强烈的旋转,并且在反手比赛中表现较弱。谷歌DeepMind分享了一个AI代理因难以应对快速击球而输给高级选手的示例视频。
根据研究人员的说法,这个乒乓球神童的影响可能不仅限于乒乓球领域。该项目开发的技术可以应用于需要快速反应和适应不可预测人类行为的广泛机器人任务。从制造业到医疗保健,潜在的应用范围非常广泛。
谷歌DeepMind此前已经通过AlphaZero和AlphaGo在棋盘游戏中击败了人类顶尖选手,现在看来,乒乓球或许将成为AI征服的下一个领域。或许在不远的将来,我们将看到AI与樊振东等顶尖选手在赛场上一较高下。