
无人机
2019年参加过首届Alpha Pilot竞赛,遗憾未能跻身前九,错过真机测试机会。昨日读到这篇论文,不禁回忆起当年的参赛经历。关于技术细节,@刘斯坦 已经讲解得很到位了。以下我结合自己的参赛经验,简单分享一些体会:从模块分解来看,大家的系统设计应该都差不多。四年前的技术已经足够成熟,飞完全程并不是特别困难。我们团队当时设计的方案如下:使用 MaskRCNN 进行检测,通过模拟门的图像让模型学会处理遮挡等问题;视觉惯性里程计采用吴毅红教授团队开源的 VINS-Mono,非常感谢其贡献;路径规划则相对简单,先控制
无人机飞到门中心前方适当位置,随后调整机头方向穿越过去。整体思路清晰且依赖于当时已有的成熟技术,因此实现起来较为顺畅。大家可以回顾一下ETH这篇论文的前身:AlphaPilot: Autonomous Drone Racing。实际上,主体模块的变化并不大。主要区别在于规划与控制部分,在Nature这篇文章中,用强化学习(RL)训练出的控制策略替代了传统方法。这也是为什么研究机器人的
同学们并不会觉得特别兴奋。此外,这个基于RL的解决方案并没有深入探讨更多复杂问题,例如在
无人机竞速场景中,多架
无人机同时起飞时,如果飞行过于激进,可能会撞到其他
无人机。而基于RL的策略其实有很大的潜力来解决这类问题(例如,当视野中出现其他
无人机时,如何选择最优策略)。手动编写这样的策略会变得极其复杂,难以处理各种动态情况。因此,利用RL方法可以更灵活地应对这些挑战。遗憾的是,Nature上的这篇论文仅提及了这一问题,却没有尝试解决撞向对手的情况。仔细研读可以发现,所学到的策略不仅可能撞击对手,还存在一定概率撞上门。
我也想简单评论一下。