论文积累 RLRL 常见公式汇总 2023-04-11 学术 linux服务器开启可视化————vcXsrv+xfce4 写在前面在linux服务器跑代码时,可能遇到可视化的情况,比如gym,或者需要图形界面做一些任务。 前置: 安装vcXsrv+xfce4,并配置 连接本地窗口假设本地ip为:172.0.0.1 在linux 操作: export DISPL 2023-04-10 实用 机器学习白板推导系列 课程地址:跳转 系列十——EM算法给出EM公式,解释E步,M步以及收敛性证明 EM算法的推导(公式是怎么来的) ELBO + KL divergence(kL >= 0) 先固定$\theta$,然后求期望(E),再滑动$\th 2023-04-04 机器学习 Google开源项目风格指南 python 风格指南导入 2023-03-28 实用 代码规范 选择算法 轮盘赌法 2023-03-23 算法 选择算法 Stable-Baselines3 Stable-Baselines3 Docs - 可靠的强化学习实现Stable Baselines3 (SB3)是 PyTorch 中强化学习算法的一组可靠实现。它是Stable Baselines的下一个主要版本。 Github 仓库: 2023-03-22 强化学习 SB3 二分图 2023-03-20 算法 图论 网络流 参考:OI Wiki|王树深 名词:最大流,阻塞流 最大流一定是阻塞流,但是阻塞流不一定是最大流 m是边,n是节点,f为最大流的大小 Ford-Fulkerson Algorithm(算法复杂度$O(f\cdot m)$,依赖于最大流的 2023-03-19 算法 图论 网络流 关于图论中诸多图的概念以及解法 仙人掌图如果某个无向连通图的任意一条边至多只出现在一条简单回路(simple cycle)里,我们就称这张图为仙人图(cactus)。所谓简单回路就是指在图上不重复经过任何一个顶点的回路。 性质定理 要将仙人掌变成树(或者森林),只需要保证 2023-03-16 算法 图论 启发式算法 一个问题的最优算法是指求得该问题每个实例的最优解. 启发式算法可以这样定义 1:一个基于直观或经验构造的算法,在可接受的花费 (指计算时间、占用空间等) 下给出待解决组合优化问题每一个实例的一个可行解,该可行解与最优解的偏离程度不一定事先可以预计。 2023-03-09 算法 启发式算法