rlQAgent
描述
q学习算法是一个模范自由,在网上,off-policy强化学习方法。q学习的代理是一个基于价值观的强化学习代理,火车一个评论家估计返回或未来的回报。
请注意
q学习代理不支持周期性网络。万博1manbetx
在q学习代理的更多信息,见q学习的代理。
更多信息在不同类型的强化学习代理,看看强化学习代理。
属性
对象的功能
例子
版本历史
介绍了R2019a
q学习算法是一个模范自由,在网上,off-policy强化学习方法。q学习的代理是一个基于价值观的强化学习代理,火车一个评论家估计返回或未来的回报。
请注意
q学习代理不支持周期性网络。万博1manbetx
在q学习代理的更多信息,见q学习的代理。
更多信息在不同类型的强化学习代理,看看强化学习代理。
介绍了R2019a