0%

FROM LANGUAGE TO GOALS INVERSE REINFORCEMENT LEARNING FOR VISION-BASED INSTRUCTION FOLLOWING

将语音控制机器人移动和拾取物品的,从policy改为从逆强化学习的reward。action和state很自然。
实验不是特别convincing,pick比navigate好.

作者提到的问题:人类语言不够精确。

-------------这么快就看完啦^ω^谢谢阅读哟-------------