Stable-Baselines3 Stable-Baselines3
Stable-Baselines3 Docs - 可靠的强化学习实现Stable Baselines3 (SB3)是 PyTorch 中强化学习算法的一组可靠实现。它是Stable Baselines的下一个主要版本。 Github 仓库:
2023-03-22
强化学习的数学原理 强化学习的数学原理
写在前面—— ——对于强化学习的建议 不要有追求速成的想法 对于自己的目标要分类合理的时间 Introduction经典书籍 课程目的 贝尔曼公式 通过计算state value来评价策略的好坏
2023-01-13
强化学习笔记 强化学习笔记
Reward相关 reward设置成[-1, 1]是normalized之后的结果,一般reward的设置是根据reward function或是根据一些经验值,比如在一些经典的迷宫场景中,reward的设置一般是一步-1的reward,作
2023-01-12
动手学强化学习 动手学强化学习
强化学习简介强化学习里面一直以来就是value based和policy based两路方法,它们各有优劣。 Value based 方法强调让机器知道什么state或者state-action pair是好的,什么是坏的。例如Q-lear
2023-01-01
【王树森】深度强化学习(DRL) 【王树森】深度强化学习(DRL)
王树深深度强化学习入门教程
2022-08-14
Gym入门使用教程 Gym入门使用教程
Gym入门使用教程
2022-08-14