1 简介
在人工智能技术逐渐发展的过程中,多智能体系统的研究一直是该领域的一个重要方向,并成为热点问题。多智能体系统的研究包括智能体间的相互合作与任务规划、架构设计与成长、自主学习与知识获取、认知建模与群体进化等一系列问题。这些问题大部分都集中在机器人足球模拟比赛的实现上[1]。因此,机器人足球模拟比赛被广泛引入作为一项标准任务,推动多智能体技术、智能机器人技术及相关领域的研究与发展。其中,机器人足球模拟进攻算法的设计属于控制策略中的高层决策问题,主要是合理解决场上队员之间的合作与协调冲突[2]。解决这些问题需要从机器人对场地的认知入手,能够通过对周围情境信息的掌控和自学习,决定机器人自身的行为与动作,从而保证总体目标的顺利完成。
2 问题分析
机器人足球仿真平台提供了比赛所需的基础环境和消息通信场景。平台通过感知接口提供的物理消息主要包括机器人的运动状态,如身份、速度(标量)、视野范围、基本动作执行次数等[3][4]。在机器人足球仿真比赛策略设计中,在对物理消息全面理解和综合分析的基础上,对阵型控制算法的优化提出了更高的要求,在实现阵型协同控制的同时,需要与平台定时同步。
经过对目前使用的仿真平台进行测试分析得知,该平台采用1/50秒作为一个仿真周期。为了保证与机器人同步,仿真平台在进入新的周期T时会以无序的方式向所有机器人发送同步信号,如下图1中虚线箭头所示,以向机器人提示仿真平台已进入新的周期。仿真平台结束同步信号的广播后,一方面按照一定的规律发送机器人的物理集成消息,另一方面需要不断响应其他机器人的动作请求,并据此调整机器人自身的方向、角度、速度和位置。 在每个执行周期结束前,平台还会将当前情境和本周期维持的其他状态下的执行结果叠加到场上作为新的情境进入下一个周期T+1,如图1中黑色填充矩形所示。在此基础上,机器人在接收到新的同步信号后,立即推断出新周期的策略,并根据接收到的各组物理消息维持自身的行为状态。图中椭圆表示自身状态的更新过程。结合状态更新和新任务的规划,机器人会选择合适的动作进行调整,如图1中白色矩形所示。最终将本周期选定的动作指令反馈给仿真平台并请求执行,虚线表示此请求。
图1 时序图
从以上分析可以看出,整个时序规律体现了对编队控制系统执行时效性的更高要求,需要保证每个仿真周期内所有机器人所承担的任务都能在规定时间内完成并反馈,尽可能避免程序执行盲区和时空资源的浪费[5][6]。因此,如何在兼顾仿真环境的局限性和公平性的基础上,充分利用平台周期性决策规则,协调机器人群体的行为和动作,高效完成进球过程中各阶段的任务,成为一个具有挑战性的研究课题。
3 三角攻击算法
本文在分析仿真平台的基础上,结合实际比赛中的任务需求,提出了一种三角进攻算法,并探讨了如何高效利用态势信息帮助机器人做出合理决策,完成助攻和基本动作的选择。
图2 三角攻击算法框架
3.1 算法框架
在三角进攻算法前期,需要获取当前环境下我方队员和敌方队员的综合信息,如图2所示,然后进行相应的数据预处理,完成对当前形势优劣势的分析判断机器人足球比赛视频,确定我方进攻路线和三角进攻决策中的核心队员。然后以核心队员为信息参考点,基于对形势的判断做出适当的分区调整,并根据分区形势规划核心机器人的行动。在此规划的基础上,根据前前后后的动作执行周期中敌方整体态势和我方态势变化情况,选择适当位置的机器人作为核心机器人的辅助机器人,并在角色分配上进行决策,与核心机器人组成三角进攻阵型。在确定阵型的前提下,根据当前形势的分析结果,从动作库中选择适当的动作作为进攻任务的分解,分别交给核心和辅助机器人执行。 在动作协调处理器的优化下,统一调配动作的执行顺序,实现三角进攻阵型的阶段性进攻目标。
3.2 分区方案
进攻场地划分主要解决保持队形和球员跑位准确性的问题,本文选取15个比赛视频的进球统计,得到表1的数据。
图3 分区图
根据球射入各个区域的概率统计,进行如图3所示的具体分区,并计算出特殊点的具体坐标,如表2所示,以便机器人进行运行定位和进攻阵型的判断与保持。场地的区域划分大致分为上、中、下进攻区和球门前的进攻区。
3.3 上路进攻计划
如图3分区所示,上攻区为特殊点D、A、B、G、C组成的子区域,当前进攻区域由球的坐标位置决定,上攻阵型如图4所示。
图 4:上路进攻阵型示意图
图5 算法执行流程
如图5所示,该算法以球的当前位置作为决策触发基准,通过球的坐标信息判断场上情况,若有利于我方进攻则进行进攻任务规划,否则继续执行防守策略。当有利于我方进攻的条件时,通过分区信息判断是否满足上路进攻的条件,若满足则执行上路进攻任务决策。本例中,基于球与球门的位置关系,得到进攻位置1的坐标值与击球角度,以此位置为基准,得到位置2的坐标值与击球角度。下一步,基于位置2为基准,得到位置3的坐标值与击球角度,明确三角进攻中核心机器人与辅助机器人的位置。 接下来我们会以位置1为目标位置,选取最佳的队员1,为其定制最佳的动作组合,完成目标位置的跑位,扮演核心进攻队员的角色,规划最有利的进攻路线;同时,以位置2、位置3为目标位置,选取两名最合适的队员扮演辅助进攻机器人的角色,并结合核心进攻机器人的动作配合要求,由动作配合处理器合理配置并执行序列决策,完成相应的跑位和接球、传球动作。除了这一系列的动作规划,我们还设计相应的守门策略,辅助完成攻防转换决策和敌方队员的拦网任务机器人足球比赛视频,确保我方三角进攻阵型能够持续保持下去。
三角进攻算法中中段和底部进攻计划的执行过程与上述顶部进攻计划大致类似。需要注意的是,对核心进攻机器人进行位置决策时,其坐标计算的依据不同。可以根据各区域的进球概率统计设计不同的位置决策方式,进而对助攻动作的执行顺序进行不同的调整和设计,以提高各进攻路线的进球效率。
3.4 球门前的进攻计划
如图3所示,将球门前的进攻区域划分为由特殊点G、B、L、M、F、H组成的子区域,通过球的坐标信息来判断是否在此区域进攻。通过分析比赛录像发现,此区域进球概率较高,且容易组织三角阵型进攻,因此适合对此区域进行更为深入细致的分析,在本文的讨论中将此区域称为“三角进攻阵型高效区域”。
图6 目标攻击执行流程
如图6所示,在球门前进攻时,阵型触发机制依然是球的位置坐标,根据球当前的位置坐标信息判断场上形势,看是否有利于我方进攻策略。在满足进攻有利条件的前提下,制定击球路线最优方案,确定击球行为的动作序列,得到路线与球门的对应关系。同时根据敌方守门员的位置信息,预测守门员路线,结合我方击球跑动路线,预测是否可以进行直接射门。若满足直接射门条件,则核心机器人直接击球射门;若不满足直接射门条件,则计算核心机器人的击球速度和角度,预测并决定下一次传球的位置和角度,进一步确定下一个核心机器人的位置信息,确定辅助机器人的角色任务和对应位置、角度。 动作协同处理器完成关联动作的规划调度,直至达到射门得分的目标。在这个过程中,其余队员除了构建三角进攻阵型外,还需要根据场上形势的变化,做出相应的跑位和角色定制,以应对攻防转换带来的任务变化。
4 仿真分析
4.1 碰撞优化与比较
在未采用三角进攻算法进行优化的进攻策略中,如图7所示,蓝队4号球员在争抢球权时,与1号球员发生了碰撞;并且蓝队1号球员垂直转向边线,产生了巨大的摩擦力,严重阻碍了4号球员的移动,失去了最佳的争抢球权机会。
三角进攻算法优化后蓝队策略效果如图8所示:蓝队4号球员仍在争抢球权,发现黄队1号球员已先触球,于是将2号球员推到4号球员身后,加大推球力度。同时考虑到球会因碰撞而弹到中场区域机器人足球比赛视频,蓝队1号球员在中场等候球权并寻找进攻机会,与3号球员一起形成三角进攻阵型,并完成了下一步动作的时机管控。可以看出,优化后,在边线争抢球权时,蓝队球员间的相互碰撞明显减少,增加了蓝队夺得球权并获得控球权的概率。
4.2 协调优化与比较
在没有进行三角进攻算法优化的蓝队策略中,如图9所示,蓝队2号球员发现进攻球门的机会,迅速奔跑至球的坐标位置,蓝队3号球员也发现了这一情况,并准备向球的方向移动,但由于蓝队2号球员已经加速,速度远快于3号球员,加之球员之间沟通受限,导致两人相撞,错失进攻机会。
经过三角进攻算法优化后,如图10所示,在球门前的进攻中,蓝队4号球员和2号球员同时发现进攻机会,由于4号球员距离球更近,角度也更合适,2号球员主动将机会留给4号球员,挡住了敌方1号球员。与此同时,蓝队4号球员发现自己没有射门角度,便将球推向球门方向,让1号球员或2号球员完成射门动作,实现进球。这个过程就是优化后的三角阵型的典型情况,蓝队4号球员、2号球员、1号球员在球门前形成三角配合区域,实现了多角度射门的可能,同时5号球员在后方,有效阻止了对方的快速反击,为我方攻防阵型转换做好准备。
4.3 射击精度优化与比较
无三角进攻算法优化的策略效果如图11所示,蓝队1号球员接到本队4号球员传球,射门,但因跑位和射门角度不当,导致球没到。
经过三角进攻算法优化后,如图12所示,在同样的情形下,蓝队1号球员将球射入球门,同时2号球员在禁区附近封堵位置,作为第二次进攻的替代射门位置,与4号、1号球员形成稳定的三角进攻阵型,进一步提高了射门的成功率。
5 结论
经过三角进攻阵型控制算法的设计分析与实践,明确了开展针对机器人足球模拟比赛的阵型设计研究的必要性。一个优秀的模拟策略系统必须具备良好的攻防策略,而策略的核心首先是顶层的阵型规划设计。通过阵型的设计,可以更好地组织机器人避免行为冲突,高效完成任务目标。本文设计的三角进攻算法是在分析总结大量比赛视频的基础上形成的,并在实战中验证了其适用性。在统计分析中,三角进攻算法在某些情况下的优势明显,尤其是在机器人对禁区前射门机会的把握上,比没有阵型控制的进攻效率高得多。但三角进攻算法的设计还存在阵型攻防转换机制有待优化、中场区域争抢球优势不突出等问题。
另一方面,在算法优化过程中也发现,算法要想达到更好的协同规划效果,还需要良好的底层基础运动模型支撑。在精准控制机器人基本行为动作的基础上,通过运动协调处理器的完善设计,将能够更好地完成队形的组织和任务的规划执行。
参考
[1] 史浩斌, 秦杨森, 楼云峰, 王闯. 足球机器人仿真比赛进攻阵型设计与控制研究[J]. 西北工业大学学报(6): 885-889.
[2] 秦杨森, 屈四宝, 楼云峰, 史浩斌, 余竹君. 基于蚁群算法的中场阵型变换技术[J]. 计算机应用研究, 2009, 26(7): 2446-2449.
[3]洪炳荣,韩学东,孟伟.机器人足球比赛研究[J].机器人技术,2003(04):86-90.
[4]杨林泉.机器人足球竞赛与设计技术[M].武汉:华中科技大学出版社,2009.
[5]丁明刚.基于多智能体强化学习的足球机器人决策策略研究[D].合肥工业大学,2017…
[6]李建兵.足球机器人图像处理与路径规划研究[D].西南交通大学,2017.