鸿漾子吧 关注:165贴子:11,481
  • 9回复贴,共1

【写着玩玩】三国杀身份局的博弈分析

只看楼主收藏回复

其实是想写博弈论的内容,就借三国杀做案例吧。


1楼2013-11-24 05:02回复
    一切还是要从期望效用函数说起。这是一个假设,也是进行博弈分析的前提。
    定义1:玩家的期望效用=自己获胜的条件概率。
    定义2:如果玩家在面对N个不同的选择时,会始终选择其中那个让自己获胜的条件概率最高的选择的话,那么我们定义这个玩家为理性玩家。
    假设1:玩家是理性玩家。


    2楼2013-11-24 05:11
    回复
      这里要说明一点,楼主假设玩家是理性玩家不表示楼主认为玩家真的是理性玩家。事实上,就楼主的观察所得,绝大多数玩家都不是绝对的理性玩家,但是大多数玩家都至少是部分的理性玩家。而非理性的那部分往往是随机的,比方说今天可能特别想玩A武将,明天可能特别想玩B武将。对这种随机因素的分析对于未来没有任何可预见性,因此楼主将其从模型中去除了。


      3楼2013-11-24 05:16
      回复
        所谓博弈,就是通过策略性的选择增加自己的期望效用。从定义1我们可以推论出一点,既主忠方,反贼方和内奸的期望效用的和是1,因为一局游戏最后只有且必定有一个势力可以获胜。从定义2我们可以推论得出另外一点,那就是当两个选择对自己的期望效用的影响相同时,玩家会在两个选择中以某概率P随机选择一个。
        举例说明:
        主内反残局,某回合,三人的期望效用分别如下:主公0.3,反贼0.2,内奸0.5。
        这时内奸可以选择打出一张万箭齐发,使得三人的期望效用变成以下的:主公0.2,反贼0.3,内奸0.5。
        因为内奸自己的期望效用没有变化,所以对于内奸来说,这张万剑打不打是无所谓,所以如果内奸是理性玩家,那么他就会以某种概率(比方说通过掷骰子)P来觉得是否打这张牌。


        4楼2013-11-24 05:27
        回复
          到此为止,分析的框架已经算是搭好了,接下来可以对身份局中的现象进行逐一分析了。
          一、选将
          每一个有一定游戏经验的玩家都会在自己心中有一个大致的选将优先级。这其实就是反应了在游戏开始时,选择各个武将的期望效用。虽然这时候有效的信息很少,但是楼主还是要强调这时的期望效用已经是一个条件概率了,因为场上玩家的背景信息(包括胜率、级别、是否是vip、位置等等)已经对获胜概率产生了影响。
          然后,这里仅仅是各个玩家自己的一个判断,基本不存在博弈。其他玩家虽然是根据主公的选将而选择自己的武将的,但是主公在选将时是不知道其他玩家的备选武将和身份的。换言之,主公是盲选。
          然而,理性玩家是会考虑到选将之后马上发生的盲狙环节,而那就带来的博弈。因此,下一个主题就是盲狙。


          5楼2013-11-24 05:36
          回复
            请注意,上个例子的结论完全可以因为数据的不同而产生变化。比方说楼主换个例子。
            主公孙权,看到八位贾诩。根据贝叶斯定律,假设八位贾诩是反贼的概率是0.7。主公一番制衡之后手里是连弩+N杀。简单起见,孙权只有两个选择:A盲狙弄死/弄残贾诩;B酱油过。效用矩阵如下:
            可能性1.1:孙权不盲狙,贾诩是反贼,孙权的效用是0.35。
            可能性1.2:孙权盲狙,贾诩是反贼,孙权的效用是0.4。
            可能性2.1:孙权不盲狙,贾诩是忠臣,孙权的效用0.35。
            可能性2.2:孙权盲狙,贾诩是忠臣,孙权的效用是0.05。
            这里的具体数字还是我臆断的,背后的逻辑就不解释了,反正仅仅是个示例而已。直接来看孙权的期望效用:
            选择盲狙:期望效用=0.4*0.7+0.05*0.3=0.295
            选择不盲狙:期望效用=0.35*0.7+0.35*0.7=0.35
            这里理性孙权的选择是不盲狙贾诩。分析原因,那就是贾诩是忠臣的代价远远大于贾诩是反贼的收益。


            7楼2013-11-24 06:09
            收起回复
              如果说看官能够很好理解以上这些的话,那么楼主接下来要说的,就涉及到博弈中比较核心的内容了。(如果前面的内容就看不懂的话,下面的基本可以忽略了)。
              现在我们考虑刚才的第二个例子,即主公孙权,八号位贾诩。之前楼主在选将的时候说了,选将不存在博弈,但是考虑到盲狙的可能性,情况就很微妙了。让我们来重新分析一下贾诩的选将。假设八号位玩家的身份是反贼,他看着手里的备选武将,然后考虑贾诩和另外一个武将甲。我们来分析一下八号玩家的效用矩阵:
              可能性1.1:选择贾诩,主公不盲狙自己,效用0.65。
              可能性1.2:选择贾诩,主公盲狙自己,效用0.45。
              可能性2.1:选择武将A,主公不盲狙自己,效用0.6。
              可能性2.2:选择武将A,主公盲狙自己,效用0.45。
              现在八号位的武将就要思考了:主公到底会不会盲狙我呢?假设他很了解这个孙权主公,知道他盲狙八号位贾诩的概率是0,盲狙武将A的概率是0.5(简单起见,假定这个数字不会变化)。那么我们来看看他的期望效用:
              选择贾诩:期望效用=0.65*1+0.45*0=0.65
              选择武将A:期望效用=0.6+0.5+0.45*0.5=0.525
              这时理性八号位玩家的选择就是贾诩。
              注意!这位玩家是反贼,然后选择了贾诩。对于主公孙权来说这意味着什么?如果孙权了解这一点,那么在他眼中,这个八号位贾诩是反贼的条件概率就不再是0.7,可能是0.8,甚至是0.9。当这个条件概率高到一定程度时,理性孙权的选择就不再是打酱油,而是盲狙这个贾诩。那么如果八号位玩家又预先想到了这一点呢?如果看官看到现在还跟上思路的话,就会想到,这个八号位玩家选择贾诩的期望效率会降低,直至最后他的理性选择变成了武将A。然后这又会影响孙权在选择盲狙时的决定了。这个过程会一直持续下去——
              ——直到达到纳什均衡。在判断纳什均衡究竟是怎样的,我们还需要一个信息,就是这个八号位玩家在抽到忠臣身份时选择贾诩的概率是多少。如果这个概率很大,那么对于孙权来说,贾诩是反贼的条件概率也许永远不够大,以至于他永远不会选择盲狙。那样的话,纳什均衡就是八号位反贼选择贾诩,孙权不盲狙。但是,如果这个八号位玩家在忠臣时选择贾诩的概率很低,假定是0.1吧,那么我们就会得到一个混合策略纳什均衡。假定八号位玩家在身份是反贼时选择贾诩的概率是P,八号位贾诩是反贼的条件概率是P‘,孙权盲狙八号位贾诩的概率是Q。
              八号位玩家:0.65Q+0.45(1-Q)=0.525
              孙权:0.4P’+0.05(1-P‘)=0.35
              可以得出,Q=0.625,P’=0.857。由此可以推出P=0.45。
              解释一下,就是在纳什均衡的情况下,八号位的这个理性玩家以0.45的概率选择贾诩(0.55的概率选择别的武将),然后孙权以0.625的概率盲狙八号位贾诩(0.375的概率不盲狙)。在这种情况下,无论是八号位玩家还是孙权都不会改变自己的策略,所以是均衡。


              8楼2013-11-24 07:21
              回复
                OK,吃饭时间到。晚上做作业!


                9楼2013-11-24 07:44
                回复
                  看到二楼就放弃了。祝你和逆天幸福@ljzhalcyon


                  IP属地:韩国来自iPhone客户端10楼2013-11-25 13:40
                  回复