FY20 创新人才班 (博客园学院)

  • ASE W2 第一次结对编程

    问题介绍: 黄金点游戏起源:最早有记载的,黄金点游戏被行为经济学家,诺贝尔经济学奖获得者Richard H. Thaler[1] 提出。英国《金融时报》通过报纸给读者提出了这样一个竞猜游戏,每人写一个0~100之间的有理数最靠近2/3乘以每个人数字平均值的人获胜。这个游戏中充满了非合作博弈的色彩,其
    MaggieWu   2019-09-22 17:51   2   15
  • 第一次结对作业

    问题定义及难点 定义: 黄金点游戏是一个多人博弈游戏,N为玩家利用强化学习设计自己的参赛Bot,根据历史数据预测每一轮的黄金点值,预测值最接近黄金点的Bot获得N分奖励,最远离黄金点的Bot得到 2分的惩罚,所有Bot的最终目的是在10000轮比赛中得到尽可能多的奖励。 难点: 1. 选用哪一种强化
    _最冷一天   2019-09-22 17:47   1   99
  • DQN的第一次尝试 -- 软工结对编程第一次作业

    DQN的第一次尝试 在本篇博客中将为大家形象地介绍一下我对DQN的理解,以及我和我的队友如何利用DQN进行黄金点游戏。最后我会总结一下基于我在游戏中看到的结果,得到的dqn使用的注意事项和这次游戏中我们应该改正的错误和改进的不足之处(可能只对黄金点有用,如果理解有误的话,可以指出,我立马改正) 问题
    yjw1029   2019-09-22 17:45   6   299
  • ASE高级软件工程 第一次结对作业

    黄金点游戏Bot Bot8前来报道 1.问题定义 a) 问题描述 N个玩家,每人写一个0~100之间的有理数 (不包括0或100),提交给服务器,服务器在当前回合结束时算出所有数字的平均值,然后乘以0.618(所谓黄金分割常数),得到G值。 提交的数字最靠近G(取绝对值)的玩家得到N分,离G最远的玩
    hsuppr   2019-09-22 17:39   2   197
  • 第一次结对作业

    问题定义 bot没一轮产生2个黄金点,黄金点在0 100之间的实数,统计没一轮所有提交,求平均并乘以0.618得到黄金点,离黄金点最近的得人数减一分,最远的得 2分,其他得0分 方法建模 使用强化学习来解决这个问题,这里使用最简单Q_table来纪录学习到的“经验”。 观测先前的比赛过程,黄金点有规
    charley-chai   2019-09-22 17:34   1   99
  • 【ASE高级软件工程】第一次结对作业

    问题定义 具体规则见: "讲义" 。大致规则如下: N个同学(N通常大于10),每人写一个0~100之间的有理数 (不包括0或100),交给裁判,裁判算出所有数字的平均值,然后乘以0.618(所谓黄金分割常数),得到G值。提交的数字最靠近G(取绝对值)的同学得到N分,离G最远的同学得到-2分,其他同
    Jenna_Wu   2019-09-22 17:25   1   115
  • 结对编程——黄金点问题

    1 问题定义 1.1 问题描述 黄金点问题是一个由多个玩家参与的博弈游戏,每个回合,所有玩家各提交liang个0到99的数字,系统计算这些数字的平均值,并乘上0.618,返回结果作为这个回合的黄金点,复盘上一回合所有玩家的提交记录,和黄金点最接近的提交数的玩家得到N分(其中N为上一回合参加比赛的玩家
    黄志鹏Zeb   2019-09-22 16:57   1   163
  • ASE —— 第一次结对作业

    问题定义 游戏规则: N个玩家,每人写一个或两个0~100之间的有理数 (不包括0或100),提交给服务器,服务器在当前回合结束时算出所有数字的平均值,然后乘以0.618,得到G值。 提交的数字最靠近G(取绝对值)的玩家得到N分,离G最远的玩家得到-2分,其他玩家得0分。 只有一个玩家参与时不得分。
    乱山尤远   2019-09-22 16:37   1   141
  • 软件工程 in MSRA 黄金点游戏-第一次结对编程

    简单介绍 第一次结对编程,邹欣老师选择了一个博弈游戏作为题目。博弈论是一门非常有趣的学科。之前竞赛时接触的博弈论大部分都是存在均衡点/必胜策略的。像这次这种多人参与,没有完美策略,你方唱罢我登台的游戏,我还是第一次参与。由于没有使用深度模型且在训练时成绩并不出众,最后成绩拿到第一确实没有想到。接下来
    XPCHF   2019-09-22 15:24   1   203
  • ASE - 第一次结对作业

    一、“黄金点”问题定义 1. 问题定义 :有N个玩家玩猜数游戏,在每一轮中,每人给出两个数字,然后计算这2N个数字的平均值,再乘上0.618, 我们把得到的结果称为“黄金点”。离黄金点最远(差值绝对值最大)的玩家扣2分,离黄金点最近的玩家得N分。如此进行 K 轮,按积分多少对玩家进行排名。关于这个游
    小、小妖精   2019-09-22 14:07   0   113