打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,
用心写好每一篇文章!
“ 奥运会正在法国巴黎如火如荼的展开者,这几天的跳水和乒乓球等项目更是吸引了国人的眼球。然而,谷歌却放出了一篇机器人在乒乓球比赛上超越了大部分人类的文章!小编不禁的想,后面的奥运会是否可以增加一项各国研发的机器人来比赛一些体育项目的运动,这无疑会增强很多的趣味性,也可以展示不同国家的科技硬实力!近年来,随着AI、强化学习、AIGC等技术的出现,虽然学习机器人策略的能力大幅提高,但在准确性、速度和通用性方面实现人类水平的性能仍然是许多领域的一大挑战。其中一个领域是乒乓球,这是一项体力要求很高的运动,需要人类运动员经过多年的训练才能达到高级水平。事实上,竞技比赛往往充满活力,涉及复杂的动作、快速的眼手协调和适应对手优缺点的高级策略。为了让机器人乒乓球系统模仿这些能力,它需要高速运动、精确控制、实时决策和人机交互。这项工作朝着这一目标迈出了关键的一步,并展示了第一个在竞技乒乓球中达到业余人类水平的学习机器人Agent。”
论文链接-https://arxiv.org/pdf/2408.03906
01-机器人参与运动项目发展历程
2016年3月15号,人工智能“阿尔法围棋AlphaGo”与韩国著名九段棋手李世石第5局比赛在弈至280手时李世石中盘认输。至此,从本月9日至15日在首尔四季酒店举行的这场五局人机大战宣告结束。“阿尔法围棋”以4:1获胜。
2022年10月15日,由一家中国公司制造的“元萝卜SenseRobot”AI下棋机器人将接连挑战两位中国象棋高手,再一次上演人工智能技术与顶尖头脑的智慧碰撞。前两次人类与AI对决项目是国际象棋和围棋,而这次是中国象棋。在网上有网民将这次挑战称为“人类与AI的第三次对决”,此消息一出,迅速登上了上海热搜本地榜。人们热切地希望,两位中国象棋棋手能够在具有强大算力的AI前扳回一局,结果可想而知!
02-LLC算法背景
由于这些苛刻的要求,乒乓球为提升机器人能力提供了丰富的环境,自20世纪80年代以来一直是机器人研究的基准。自此以后,已经开发了许多乒乓球机器人,并在将球送回对手一侧、击中目标位置、粉碎、合作拉力以及乒乓球的许多其他关键方面取得了重大进展。然而,之前还没有研究过机器人与以前看不见的人类对手进行一场完整的乒乓球比赛。
通过分析29场机器人与人类的比赛来评估,其中机器人赢得了45%(13 /29)。所有人类都是看不见的玩家,他们的技能水平从初学者到锦标赛级别各不相同。虽然机器人与最先进的玩家输掉了所有比赛,但与初学者相比,它赢得了100%的比赛,与中级玩家相比,赢得了55%的比赛,这证明了它在业余水平上的表现。
这些策略仅在模拟环境中(但使用真实的球状态)使用黑匣子梯度传感(BGS)进行训练。并将学习到的零样本策略转移到物理世界。在部署时,作者冻结了样式选择器和技能。在推理过程中,HLC使用样式选择器选择侧面。启发式模块列出了最有效的技能。H值(在线对手模型)选择最喜欢的技能,技能执行动作。
如上图所示,乒乓球机器人是一个6自由度的ABB IRB 1100手臂,安装在两个Festo线性龙门架的顶部,可以在二维平面内运动。在工作台上左右移动的x台架长4m,朝向和远离工作台移动的y台架长2m。ABB臂上连接着一个3D打印的桨柄和带有短管橡胶的桨。一对工作在125Hz的Ximea MQ013CG-ON相机捕获球的图像,这些图像被用作神经感知系统的输入,该系统以相同的频率产生球的位置。作者使用一个由安装在比赛区域周围的20个摄像头组成的PhaseSpace运动捕捉系统来跟踪人类对手的球拍。
真实环境由跟踪球的神经感知系统、跟踪人类玩家划桨姿势的运动捕捉系统、跟踪游戏状态的状态机和向策略提供球位置和速度、机器人位置等数据的观察模块组成。此外,作者还构建了一个基于MuJoCo物理引擎的相应仿真环境。
05.02-LLC训练策略
LLC训练谱系LLC x=最终系统中LLC的ID。正手(FH)和反手(BH)LLC均由两名独立训练的通才开发。其中一个通才是随着数据集周期一起开发的,而另一个则是在最终确定数据集后才进行训练的。两名种子正手多面手都被部署(LLC 0和LLC 2),而反手只部署了一名种子多面手(LLC 9)。
05.03-LLC策略选择
否则,它必须通过在相应的LLC技能表中找到最相似的球状态并获得返回统计数据来确定许多拉力赛LLC中哪一个表现最佳。启发式策略被应用于这些统计数据,并产生候选LLC的短名单,最终的LLC是通过加权选择选出的。将以50Hz的频率查询所选LLC的当前球状态,以确定机器人的动作。
05.04-任务分配数据集
上图展示了机器人与匹配者之间的比赛统计结果。机器人赢得了45%的比赛。100%对初学者,55%对中级玩家,没有对高级玩家的比赛。这表明机器人的表现处于业余中级水平。人类对手技能等级:B=初级,I=中级,A=高级,A+=高级+。
关注我,AI热点早知道,AI算法早精通,AI产品早上线!
欢迎你的加入,让我们一起交流、讨论与成长!
若二维码失效:关注公众号--》交流分享--》联系我们(备注:AI产品汇)
禁止私自转载,需要转载请先征求我的同意!