-
建造者模式的理解
建造者模式中有两个关键角色————打工仔builder和老板Director 打工仔有一个伴生对象,并有很多为这个伴生对象添砖加瓦的技能(方法),但打工仔自己不知道到底该怎么建设自己的伴生对象。 而打工仔为老板打工,老板叫他怎么建设它就怎么建设,最后打工仔把建设好的对象奉献出来,就完成了对象的生产。 -
C++ 程序常见错误表
C++ 程序常见错误表 -
学习日志-2021.11.08
学习日志-2021.11.08 其他Q-Learning SA-Q-learning 为了平衡Q-learning的探索与利用,基于Metropolis准则提出的算法 算法描述 初始化Q表 对每一轮次(episode): 随机选择或初始化一个状态 \(s_t\) 对于每一步(step): 从动作空间 -
论文阅读-2021.11.06
论文阅读-2021.11.06 Backward Q-learning: The combination of Sarsa algorithm and Q-learning 自适应Q-learning 算法描述 初始化Q表,设置 \(TH_P、TH_N、C、β和k\) 循环(轮次episode): -
第一天:需求分析
###需求来源:课外作业 ###界面和功能要求:设计并实现一个计算器。参照手机的计算器界面,即一个标准计算器,通过一个按钮转化为科学计算器 ###1、标准计算器:加减乘除、{MR、MC、M+、M-}、小数点、%、退格、清空、计算键 从该页面中可知,实现要点有: 实现一个输入框,实现标准计算表达式的输 -
学习日志-2021.10.25
学习日志-2021.10.25 由于昨天仿真实验没有观察到曲线上升的过程,在昨晚睡前将博弈轮数设置为50000次,困境强度 \((DS)\) 为0.02,Q-Learning智能体占比约为0.1 \((\frac{1018}{10000})\) ,截止到第二天中午十二点,已经完成约25000轮次,重 -
学习日志-2021.10.24
学习日志-2021.10.24 硕士论文第二部分复现 复杂网络上的合作行为演化研究 ——基于 Q-learning 算法 源码地址:RL_for_Gaming_to_choose_action(Q-Learning) 在相同智能体比例,不同困境强度下的演化: 合作率演化图: 从左至右困境强度 $(D -
学习日志-2021.10.18
学习日志-2021.10.18 硕士论文复现--选择学习对象 论文内容是在 200×200 的边界循环网络下,实际情况下会占用大量的计算资源,导致计算时间较长,在复现时为减少时间消耗,改为 100×100 的边界循环网络。 源码地址 复现目标 使用Q-Learning算法,探究学习对象的选择对网络演 -
学习日志-2021.10.13
学习日志-2021.10.13 记录一下项目 地址 参考之前运行的项目,将算法运用到这个游戏中。 项目描述 红色代表小鸟 黑色方块组成柱子 状态表示:以柱子缺口底部右侧的黑色方块为坐标原点,与当前小鸟坐标的差值 \((Δx,Δy)\) 表示一个状态。 行为 飞一下:小鸟向上移动一格 什么也不做:往下 -
学习日志-2021.10.11
学习日志-2021.10.11 复习一下机器学习书本第四章内容 决策树 基本算法 这是一个递归的过程,有三种情况会导致递归返回: 当前节点包含的样本全属于同一类别,无需划分 当前属性集为空,或是所有样本在所有属性上取值相同,无法划分 当前结点包含的样本集合为空,不能划分 输入:训练集 \(D = \