FROM LANGUAGE TO GOALS INVERSE REINFORCEMENT LEARNING FOR VISION-BASED INSTRUCTION FOLLOWING 发表于 2019-09-17 更新于 2021-04-08 分类于 科研 , 论文 , 论文笔记 , 深度学习 , 强化学习 热度: 讨论区: 将语音控制机器人移动和拾取物品的,从policy改为从逆强化学习的reward。action和state很自然。实验不是特别convincing,pick比navigate好. 作者提到的问题:人类语言不够精确。 -------------这么快就看完啦^ω^谢谢阅读哟-------------