分类: 强化学习 | 马克图布

文章分类
实用 6 强化学习 7 机器学习 18 英语 1 数学基础 12 android 3 算法 5 图论 3 深度学习 2 计算机网络 1 学术 3 你说，人生你好！ 2
                            
                            Stable-Baselines3
                        
                                Stable-Baselines3 Docs - 可靠的强化学习实现Stable Baselines3 (SB3)是 PyTorch 中强化学习算法的一组可靠实现。它是Stable Baselines的下一个主要版本。
Github 仓库：
                            
                                2023-03-22
                            
                                    强化学习
                                
                            SB3
                        
                            从零实现RL
                        
                                DQN
                            
                                2023-02-15
                            
                                    强化学习
                                
                            强化学习的数学原理
                        
                                写在前面—— ——对于强化学习的建议

不要有追求速成的想法
对于自己的目标要分类合理的时间

Introduction经典书籍

课程目的

贝尔曼公式

通过计算state value来评价策略的好坏

                                2023-01-13
                            
                                    强化学习
                                
                            强化学习笔记
                        
                                Reward相关
reward设置成[-1, 1]是normalized之后的结果，一般reward的设置是根据reward function或是根据一些经验值，比如在一些经典的迷宫场景中，reward的设置一般是一步-1的reward，作
                            
                                2023-01-12
                            
                                    强化学习
                                
                            动手学强化学习
                        
                                强化学习简介强化学习里面一直以来就是value based和policy based两路方法，它们各有优劣。
Value based 方法强调让机器知道什么state或者state-action pair是好的，什么是坏的。例如Q-lear
                            
                                2023-01-01
                            
                                    强化学习
                                
                            【王树森】深度强化学习(DRL)
                        
                                王树深深度强化学习入门教程
                            
                                2022-08-14
                            
                                    强化学习
                                
                            Gym入门使用教程
                        
                                Gym入门使用教程
                            
                                2022-08-14
                            
                                    强化学习
                                
                            gym