0%

Sim-Real Joint Reinforcement Transfer for 3D Indoor Navigation

强化,模仿学习,迁移

提出通过合成数据渲染环境随后将策略迁移到真实环境中。虽然合成环境有利于来促进现实世界中的导航训练,

但真实环境与合成环境有两个方面不同。首先,两种环境的视觉表示具有显着的差异。其次,两个环境的房屋计划有很大不同。因此,需要在强化模型中调整两种类型的信息,即视觉表示和策略行为。视觉表征和策略行为的学习过程是互惠的。

我们提出联合调整视觉表现和策略行为,以实现环境和策略的相互影响。具体来说,我们的方法采用了用于视觉表征转移的对抗特征适应模型和用于策略行为模仿的模拟策略。实验结果表明,我们的方法在没有任何额外的人类注释的情况下优于基础模型高达21.73%。

应用场景:

本文提出的视觉特征适应模型和策略模拟模型可以有效将机器人在虚拟环境中学习到的策略和特征迁移到实际场景中,有利于导航机器人,无人车等需要大量数据训练的应用在缺乏复杂场景的真实数据时,通过渲染环境获得更好的策略。

视觉特征适应模型和策略模拟模型,可以有效将机器人在虚拟环境中学习到的策略和特征迁移到实际场景中

基于单视角深度图恢复完整三维场景,提出了一种基于三维 与 二维卷积神经网路协同学习的多视角补全技术,并首次将深度强化学习用于引入该问题的求解过程。本文的方法在公开数据集上获得了世界领先水平。

-------------这么快就看完啦^ω^谢谢阅读哟-------------