自主移动机器人的基本要求之一是其导航能力。机器人必须能够按照给定的坐标从当前位置导航到地图上指定的目标位置,同时还要避开周围的障碍物。在某些情况下,需要机器人能够以较高的导航速度尽快到达目的地。然而,导航速度较快的机器人通常具有较高的碰撞风险,额能会影响到机器人和周围环境。
为了解决这个问题,丰桥工业大学(TUT)计算机科学与工程系主动智能系统实验室(AISL)的研究小组提出了一个新的框架,用于训练移动机器人快速导航,同时保持低碰撞率。该框架在训练过程中结合了深度强化学习(DRL)和课程学习,让机器人学会快速又安全的导航策略。
论文第一作者、博士生Chandra Kusuma Dewa解释说,DRL可以使机器人通过反复尝试各种动作,根据环境的当前状态(如机器人位置和障碍物放置)学习适当的动作。此外,当前动作的执行会在机器人达到目标位置或与障碍物发生碰撞时立即停止,因为学习算法假设动作已经被机器人成功执行,该后果需要用于改进策略。所提出的框架可以帮助维持学习环境的一致性,使机器人可以学习到更好的导航策略。
此外,TUT的AISL负责人Jun Miura教授介绍说:“该框架遵循课程学习策略,在训练情节开始时为机器人设定一个小的速度值。随着集数的增加,机器人的速度会逐渐增加,这样机器人就可以在训练环境中从最简单的关卡(如动作缓慢的关卡)到最困难的关卡(如动作快速的关卡),逐渐学会快速又安全的导航这一复杂任务。
由于训练阶段的碰撞是不可取的,所以学习算法的研究通常是在模拟环境中进行的。研究人员模拟了室内环境进行实验。实践证明,所提出的框架在训练和验证过程中,与之前已有的其他框架相比,都能使机器人的导航速度更快,成功率最高。研究人员认为,根据评估结果,该框架是有价值的,它可以广泛应用于任何需要快速但安全导航的领域的移动机器人的训练。
论文标题为《A framework for DRL Navigation With State Transition Checking and Velocity Increment Scheduling》,发表在《IEEE Access》上。