FROM LANGUAGE TO GOALS INVERSE REINFORCEMENT LEARNING FOR VISION-BASED INSTRUCTION FOLLOWING

发表于 2019-09-17 更新于 2021-04-08 分类于科研，论文，论文笔记，深度学习，强化学习热度：讨论区：

将语音控制机器人移动和拾取物品的，从policy改为从逆强化学习的reward。action和state很自然。
实验不是特别convincing，pick比navigate好.

作者提到的问题：人类语言不够精确。

-------------这么快就看完啦^ω^谢谢阅读哟-------------