灵动分享会-机器人的强化学习

发表于 讨论求助 2023-05-10 14:56:27

说到学习和思考,如今已不再是人类的专利。随着人工智能的迅速发展,机器人也开始掌握学习和思考的本领。


那么机器人如何像人类一样,懂得学习和思考,并且不断进化自身呢?


作为一个不断探索的人工智能公司,这种问题自然是不在话下。在本周一的分享会上,机器人的强化学习成为了这次分享的主题。



何为强化学习呢?


强化学习最初来源自行为主义理论,当物体或者机器在环境的刺激下应该如何做出适当的回应,而当该回应满足了预期时,便可以认为该物体或者机器学会了某种知识。


强化学习作为一个序列决策问题,需要做出一系列决策达到最终目的。当然,如果想要更加形象的了解强化学习,我们可以看这样一个例子:


当你在追求一个女生过程中,你的每一个行为都会对你最终的追求是否成功产生影响,那么你一定会去思考每一步应该采取什么行动才能达到最优的追求效果。这就可以看做是一个序列决策问题,当然你也肯定很想知道应该怎么去解决这个问题。


假如你是第一次追求女生,那么你应该会去向别人请教,看微博、看贴吧,来收集各种各样的撩妹知识。这一个过程就可以称为“experience data”。利用离线数据来训练一个模型。


假设你是一个经验丰富的老司机,但是却发现按照以前的套路来总是不能成功。所以你尝试了其他的方法,反而获得了更好的效果,“more optimal policy”。


那么将上述过程对应过来


action:你的行为
state:你观察到的妹子的状态
reward:妹子的反应:开心or不开心


至此,一个强化学习的模型就基本建立了。同样机器人的强化学习也是这种道理。



当然,关于机器人的强化学习,还有着更为丰富的内容,等着我们去探寻。


而灵动科技也会持续分享更多的黑科技,让大家了解那些即将改变我们生活的科学智慧。

发表
26906人 签到看排名