智商吧 关注:203,538贴子:1,885,281

有关概率的一个疑似悖论

只看楼主收藏回复

《智商》吧:有关概率的一个疑似悖论,haolizhong4924
【按:这是在《民科》吧看到的一个有意思的问题。说说我的看法,想请各位网友不吝赐教。原题见:《民科》吧,《百分之99的民科吧吧友都不会的一道简单数学题》,发帖者:@薛奎已统一理论】
.
原题:
这里有两个红包,其中一个红包的钱数是另一个红包的两倍,让两个人随机拿取其中一个红包。
此时,给他们一次交换红包的机会。
甲心想,我手里拿着的是x,如果对方拿着的是我的两倍即2x,那我得到x元钱。假设对方手里拿着的是我的1/2倍,那我损失x/2,也就是说,交换在平均上的收益大于损失。
然而乙也是一样想的。
请问为什么交换的钱在数学期望上上涨了?而且对于甲乙双方都一样?
.
除了讨论这个题目中疑似悖论的矛盾出在何处以外,我还想进一步讨论:
假如只给甲方看到拿着的钱数后决定交换与否的特权的话,甲方有没有办法,有什么办法,利用这个特权取得上涨收益的数学期望?
.
下面是我的看法。各位有什么高见望踊跃评论赐教。
(待续)


IP属地:陕西1楼2024-07-26 16:28回复
    (续)
    顶楼所说的想法错在哪里?错在:
    .
    通常,没有理由判定各个分情况出现的概率孰大孰小时,我们会按“概率均匀”来认定,即认为它们都相等。例如上面的叙述中,认定对方拿到的究竟是2x,还是x/2,认为概率各为1/2。
    但在采用这种“概率均匀”办法时,需注意两点:
    .
    一是:
    因“没有理由”,就按“概率相等”来认定,是早期古典概率论中常采用的原则。但是人们已经发现它的不合理之处。
    凡了解过“贝特朗悖论”的朋友可以知道,采用不同的参数作为样本空间,何为“概率均匀”,是有歧义的,会产生矛盾的。因此这个古典的原则并不可靠。
    所以,现代的概率论中,如果已知条件中没有显式地指明在哪种样本空间里“均匀”的话,初步分析时仅因“没有理由”而认定的“概率相等”,只能算作预估,不能算定论。
    随着进一步分析时新发现的信息提供新的“理由”,有可能需要改动的。
    .
    二是:
    如果是“无限多种分情况”,那么,不管是否给出概率如何分布的已知条件,都不可以认为“概率均匀”,必须认为存在一个不是常数的“分布曲线”,且满足一定数学特征,否则会违反概率论的公理。
    .
    后面这第二点,是因为:
    按概率论公理,各分情况下的概率之和应该等于1。
    无限多种分情况,求其和须采用极限概念(对连续分布用无穷积分,对离散分布用级数);
    .
    例如一个量是非负实数,设它取值为x附近的概率密度为p(x),则必须:
    x由零到∞的积分∫p(x)dx = 1。
    .
    但我们知道,如果认为“概率均匀”,即p(x)是一个常量,那么:∫p(x)dx或者不收敛(如果p(x)≠0),或者收敛为零(如果p(x) = 0),总之,不可能是1。
    要想使无穷积分∫p(x)dx收敛为1,p(x)就不可以是常量。
    .
    本题目的问题就出在这两点上。
    下面具体到本题来说明。
    (待续)


    IP属地:陕西2楼2024-07-26 20:27
    收起回复
      (续)
      设两个红包中的钱,少者为n,多者为m,m = 2n。
      第一次拿取,拿到的x是等于m,还是等于n,因没理由,暂认为概率各1/2。
      对再次交换后的预期:如果x是m,交换后损失x/2;如果x是n,交换后收益x。故顶楼的想法是认为:二者平均,损失小于收益。
      .
      但顶楼这个计算,除了认为x是m和n的概率各1/2以外,还认定了x值已经确定。
      试想,说“x/2 < x”,是指的同一个x。如果x值不确定,即考虑到可能拿到不同x的情况的对比,拿得x较大时的“x/2”,不见得比拿得较小x时的“x”小。x值确定,才能有上述估计。
      .
      然而,一旦x值确定,那么x值内隐含的信息就与上述“概率各1/2”有冲突了。
      这是因为,下面的分析可以得知:
      如果x越大,则“x是n的概率”越小,“x是m的概率”越大。
      .
      所以,这两个概率不可能固定等于1/2。
      .
      下面说明如何分析出这个规律。
      (待续)


      IP属地:陕西3楼2024-07-26 20:39
      回复
        (续)
        n和m都是未知正数,分布于正半数轴,有无穷多种可能取值。上面2楼第二点已说明过:此时题目虽没有说其概率如何分布,我们也可断定一定不是均匀分布,而是有一定的分布曲线,如下图。
        .
        曲线pm(x)、pn(x)的具体形状数据虽然不知道(图中只是示意),但可以肯定存在下述特征:
        首先,曲线下面积为1(这是根据概率论的公理);
        其次,右边无穷远处趋于0(这是积分收敛的必要条件);
        还有,因为m = 2n,所以pm(x) = pn(x/2)/2。故m的曲线比n的曲线向右加宽到2倍,而高度(概率密度)缩小到一半,曲线的峰值点也向右移了。

        可以看出,如果拿到的x值等于图中H点,那么这个x是n的概率和是m的概率一样大。不过,因为曲线具体形状未知,故这个H点的位置也是未知的。
        x值越小,则x是n的概率越大;
        x值越大,则x是m的概率越大。
        .
        也就是说,x较小,则交换后较大概率出现收益;x较大,则交换后较大概率出现损失。
        再算上每次损益时的损益量,可知损益量的数学期望是x的函数,大致趋势应是x较小时为正,x较大时为负。
        (待续)


        IP属地:陕西4楼2024-07-26 20:55
        收起回复
          (续)
          这就可以解释顶楼的矛盾了。
          .
          若完全不考虑x的大小,那么,除应认为将拿到的x是m还是n,概率各1/2以外,对于交换一次后的损益的数学期望,也应该认为是零(即交换前后钱数的数学期望不增不减),才合理。
          .
          若确定了x值,那么,对再次交换后损益的的预期,则除要考虑如上所说的损失x/2和收益x的大小以外,更应该考虑发生损失和收益的概率大小。
          而这两个概率是随x的不同而不同的,并非简单地各1/2了。
          .
          从上面分析知道,假如曲线pm(x)和pn(x)数据已知,交换一次后的损益的数学期望可以定量算出;即使曲线不知,但趋势仍然可知;即:
          若x较小,期望为收益;若x较大,期望为损失。
          并非顶楼所说的都是收益大于损失。
          更何况,交换前,甲乙两人见到的x是不同的。
          .
          这就是顶楼疑似悖论的来源。
          (待续)


          IP属地:陕西5楼2024-07-26 22:08
          回复
            (续)
            上面的分析合理与否,如有疑惑,可以如下验证:
            .
            上面所说的“确定了x值后”的概率,其实就是一种条件概率,即“当x等于某个确定的值”条件下的概率。此时的数学期望也就是该条件下的数学期望。假如曲线pm(x)和pn(x)数据已知,它们都是可以定量计算出来的。
            .
            如果前面的分析无误,那么我们根据这些条件概率,用全概率公式反推出“无条件概率”,即前面所说的不考虑x的大小的概率,应该和开始的认定一致:各二分之一。同样办法,反推出不考虑x的大小交换一次后的损益的数学期望,也应该是零。
            不妨推导一遍看看。
            .
            先考虑概率:
            x值确定后,
            x是n的概率为Qn(x) = pn(x)/(pm(x)+pn(x))
            x是m的概率为Qm(x) = pm(x)/(pm(x)+pn(x))
            .
            而具体拿到x的概率也有其分布曲线,其概率密度应为
            Q(x)=(pm(x)+pn(x))/2
            .
            按全概率公式,不确定x值时,拿到x是n的概率应为:
            x由零到∞的积分∫Q(x)Qn(x)dx
             = ∫((pm(x)+pn(x))/2)(pn(x)/(pm(x)+pn(x))) dx
             = ∫( pn(x)/ 2)dx
            我们已经知道pn(x)的曲线下面积为1,显然这个积分等于1/2。
            同样道理,拿到x是m的概率也等于1/2。

            再考虑交换损益的数学期望:
            x值确定后,如果再交换的话,出现损益的期望S(x)应为:
            S(x) = Qn(x) * (+x) + Qm(x) * (-x/2)
              =  pn(x)/(pm(x)+pn(x))* (+x)
               + pm(x)/(pm(x)+pn(x)) * (-x/2)
              = (pn(x) * (x) - pm(x) * (x/2) ) / (pm(x)+pn(x))
            按全概率公式,不考虑x的大小,再交换出现损益的期望应为:
            x由零到∞的积分∫Q(x)S(x)dx
             = ∫((pm(x)+pn(x))/2)((pn(x) * (x) - pm(x) * (x/2) ) / (pm(x)+pn(x))) dx
             = ∫( (pn(x)* (x) - pm(x) * (x/2) ) / 2) dx
            将pm(x) = pn(x/2)/2代入,得:
            上式=∫( (pn(x) * (x) - pn(x/2)/2 * (x/2) ) / 2) dx
              =∫( pn(x) * (x) / 2) dx - ∫( pn(x/2) * (x/2) /4) dx
            设t= x/2,代入第二个积分,则:
            上式=∫( pn(x) * (x) / 2) dx - ∫( pn(t) * (t) / 2) dt
            其中第一个∫是x由零到∞的积分,第二个∫是t由零到∞的积分,显然两个积分结果相等,故:
            上式= 0 。
            .
            都与前面的认定一致,无矛盾。
            (待续)


            IP属地:陕西6楼2024-07-26 22:15
            收起回复
              (续)
              下面,在开始讨论顶楼后面说的那个“进一步”的问题之前,先对有朋友针对我的上文所提的质疑、追问,做点解释。
              .
              ◆我上面3楼说:计算时,说:“如果x是m,交换后损失x/2;如果x是n,交换后收益x;而x/2 < x”这话,就意味着“x值已经确定”。
              对此,有朋友质疑说:“我在没有看钱数之前说这话呢?还能算x值已经确定吗?”
              .
              其实,“看不看”是次要的,重要的是您这话所依据的背景条件是什么:
              .
              背景条件一:m和n已经确定(由发红包者决定),而拿到哪个未知。此时要猜测的是能拿到哪个。
              背景条件二:已经知道拿到的钱数x,而不知这个x是m还是n。此时要猜测的是发红包者是如何发的。
              .
              用俗话说,前者的“概率”指的是拿钱者的“手气”,后者的“概率”指的是发钱者的“脾气”(所以我4楼要考虑钱数的概率分布曲线)。
              .
              我说意味着“x值已经确定”,意思就是:说这话时依据的是后一个背景条件,而不是前一个。
              .
              试想,假如说这话时依据的是前一个背景条件,x值没有确定而m和n已经确定,那么,这句话里的两个x不是同一个数,前一个x是m,后一个x是n,而本来m就是n的两倍,这里再说x/2 < x显然不对了。
              (待续)


              IP属地:陕西7楼2024-07-27 13:25
              回复
                这个悖论吧里讨论过,总结一下无非四个字:弃车保帅。


                IP属地:吉林来自Android客户端8楼2024-07-28 01:08
                回复
                  说两点:
                  其一、上面2楼主要意思都对,但有一句话有欠严格之处。
                  并非任何“无限多种分情况,”都不可以认为“概率均匀”。
                  例如,若X的值域是数轴上一个区间。虽说一个区间中有“无限多个点”,也可说是“无限多种分情况”,但还是可以“分布均匀”的。因为一个区间中常数的定积分是可以等于1的。
                  不过楼主的具体结论是对的。“零到∞”的概率均匀是不可能。


                  IP属地:陕西9楼2024-07-30 12:58
                  收起回复
                    其二、
                    很赞同上面7楼说的:
                    “不确定x”背景下,“概率”指的是拿钱者的“手气”;“ x已确定”背景下,“概率”指的是发钱者的“脾气”。
                    这话说的很对。
                    假设已经给的两个红包,一个20元,一个40元,猜你会拿到哪个?没理由说哪个的可能性更大。纯靠“手气”。只能估计各1/2概率。
                    但假设,拿到的x是20元,现在要猜的是人家发红包的时候,究竟是发的“20元、40元”,还是“10元、20元”。
                    这就要看发红包的人的背景了,不管是经济条件,还是发钱者的“脾气”, 还是别的条件,当然不可能“零到∞概率均匀”的。只能设想有个分布曲线。
                    这两种情况下判断的概率,显然是有很大不同的。
                    顶楼的矛盾看来就是出在混同了这两种不同情况。


                    IP属地:陕西10楼2024-07-30 13:14
                    收起回复
                      (续7楼)
                      多谢各位朋友指教。因故拖延了几天望原谅。
                      .
                      下面再说顶楼最后提出的“进一步讨论”的问题。即:
                      假如只给甲方特权,看到钱数后可决定交换与否的话,甲方有办法“占便宜”吗?
                      我的答案是:有办法。
                      .
                      上面我们已经得出了结论:
                      在知道钱数x以前就做决定要不要交换,对最后的数学期望没有影响。
                      .
                      不难证明:以下三种对策,不管采取哪一种,最后的数学期望是一样的:
                      一、一律不交换;
                      二、一律交换;
                      三、随机地以一定概率(此概率与钱数x无关)来决定交换与否。
                      .
                      然而,在看到钱数x以后,就多知道了一点信息。
                      上面我们已经分析过,交换后的损益量的数学期望是x的函数,虽具体的曲线形状未知,但大致趋势知道了:是x较小时为正,x较大时为负。如下图。

                      所以,有了“知道x”这个条件,只要有一种对策,能使得:x越小,就越倾向于“要交换”;x越大,就越倾向于“不要交换”;那么,最后的数学期望是可以比上面三种对策再提高的。
                      .
                      下面具体设想一下。
                      (待续)


                      IP属地:陕西11楼2024-08-08 19:20
                      收起回复
                        (续)
                        设想,甲方自己定一个自认为的“中间数”Y,决定对策是:“如果x<Y,就交换;否则,就不交换”,行不行呢?
                        这样做,从概率上说,也能一定程度“占便宜”,至少不吃亏。
                        .
                        这也不难证明。
                        11楼说的损益量数学期望,虽然具体曲线不知道,但肯定会存在一个过零点X0。假如我们选的Y恰好等于X0,显然最好,不必说了。
                        .
                        假如Y和X0不等,例如Y<X0,那么这种对策的效果,等于在上面11楼的三种对策中“对策一”的基础上改动——将x<Y的区间由原来的“一律不交换”改为交换,而x<Y的区间中原来交换的期望是收益大于损失,故此对策等于对“对策一”的优化,效果不劣于“对策一”。
                        .
                        反之,假如Y>X0,那么按相似的道理,这种对策等于在上面11楼的“对策二”的基础上优化,效果不劣于“对策二”。
                        而“对策一”、 “对策二”效果一样。故此对策概率上是“占便宜”的。
                        .
                        不过,我们已经知道,x不可能在实数域“均匀分布”,必有如4楼所述的分布曲线。
                        而只有所选的“中间数”Y,处于该曲线的分布区域以内,上述“优化”才会实际有效。
                        而该曲线,如7楼所说完全取决于“发钱者的脾气”,甲方在确定Y时对其完全未知。
                        像下面三个图,只有第一个优化才有作用。假如像后两图,Y选到了分布区域以外,x<Y和x>Y二者必然只有一种可以出现,上述“优化”的机会必然不会遇到。实际上就完全和对策“一”、“二”一样了。
                        .

                        也就是说,这种对策虽然概率上是“占便宜”的,但因Y选的不好而不起作用的可能性很大。所以不够可靠。
                        (待续)


                        IP属地:陕西12楼2024-08-09 13:51
                        回复
                          (续)
                          楼上(12楼)的对策之所以“不够可靠”,关键在于:Y的选择,只有选在x的概率曲线的分布区域中才有作用,而甲决定Y的时候,完全不知道x的概率曲线。
                          .
                          要想避免因不知x的分布范围而形成“不起作用”的结果,可换个思路。
                          .
                          因为下面的讨论要和11楼的“对策三”联系,为此先对 “对策三”做一点解释:
                          .
                          “对策三”里说到的“随机地以一定概率来决定”是一种什么操作?
                          具体就是:
                          .
                          自己制定一种规则,使得:
                          按照这个规则操作一次所得的决定结果,是随机的,别人无法预知;但假如按照同一个规则多次试验所得的结果的统计,可以确定其概率为一个要求的值。
                          例如:做决定前掷骰子,掷到2、5点就交换,掷到1、3、4、6都不交换。这就是一种“概率为2/6(即1/3)地随机交换”。
                          .
                          11楼所说的“对策三”的意思就是:
                          只要你决定交换与否,是按照上面所说的那样一个规则,而这个规则所确定的“一定概率”,与钱数x无关,那么,最后的数学期望,就与“对策一”和“对策二”都一样。
                          (待续)


                          IP属地:陕西13楼2024-08-19 18:00
                          回复
                            (续)
                            现在我们说的换个思路,就是:
                            类似于11楼的对策三,同样是“随机地以一定概率来决定交换与否”,但不同的是:此概率由看到的钱数x来确定,x越大,“要交换”的概率就越小,“不要交换”的概率就越大。
                            .
                            具体点说,就是设计一个值域在1到0之间的减函数g(x),实际操作时,使“要交换”的概率等于g(x), “不要交换”的概率为1-g(x)即可。
                            设计g(x)的办法有很多。例如:令g(x)=1/(x+1),或者g(x)=0.9^(-x),……,等等。
                            若g(x)不同,则效果有量的差别,但都满足这里的讨论。
                            .
                            因为g(x)可能需要连续改变,不是简单分数,不便采用楼上所说的掷骰子等,实际操作时可以借助一个类似“抽奖转盘”那样的工具,具有0到1之间的连续均匀刻度,你确定要求的概率g(x)以后,做决定前就转一次,所停位置的刻度不超过g(x)就交换,超过就不交换,即可。
                            当然,也可以利用电脑编写一个0到1之间的随机数发生器来代替这个“抽奖转盘”,不详述了。
                            .
                            只要拿这种方法和11楼的“对策三”做个比较,不难证明它肯定是优于“对策三”的。
                            所以,它是一种利用看到钱数后决定交换与否的决定的特权“占便宜”的对策。
                            (待续)


                            IP属地:陕西14楼2024-08-19 18:19
                            回复
                              (续)
                              可以将12楼和14楼的对策,做一比较。
                              .
                              如果对减函数g(x)的要求宽一点,允许不严格的减函数(即允许有水平段),那么可以把12楼方案看做14楼方案的一个特例,即14楼方案等于是定义g(x)为:
                              “如果x<Y,则g(x)=1;否则,g(x)=0”。
                              如此,“不严格的减函数”g(x)的“减”,只出现在Y点前后,其它部分全是水平段。
                              .
                              前面说,12楼的方案有“因Y选得不好而不起作用的可能性”。
                              但是,如果选得好,起的优化作用可能比14楼方案更明显。
                              .
                              这是因为,12楼方案里g(x)在Y点前后由1直接减到零;
                              而14楼g(x)的递减,分布在0到无穷的范围,每一部分的“减”,都是少量的,故与11楼的“对策三”相比虽有优化,但优化的程度不可能大。
                              .
                              举一个极端化的例子:
                              假设该活动内定钱数大者m在30~40元,小者n在15~20元。
                              .
                              如果采用12楼方案,那么:
                              假如甲确定的Y在20~30元之间,则100%可以拿到大者,结果最优。
                              但假如确定的Y在20元以下,或40元以上,拿到大者的概率只是50%,等于完全没有优化。
                              .
                              而采用14楼方案,拿到大者的概率总能大于50%,但都大不多。
                              .
                              再从实用的角度做点讨论:
                              .
                              12楼的方案的“不可靠”,源自不知钱数的分布曲线,所以无法避免将Y选在“不起作用”的地方。
                              但在实践中,钱数的分布曲线虽不公开,但并非所有信息都不能根据客观情况来估计猜测。只要知道了部分信息,就可能在上述方案基础上进一步优化。
                              .
                              如:我们如果猜到m的下限不会小于Y1,则可令x<Y1时g(x)=1;
                              如果猜到n的上限不会大于Y2,则可令x>Y2时g(x)=0;
                              在其它区间中再按“减函数”要求来设计g(x);
                              如此,g(x)“减”的陡度可以尽量的加大,效果自然会进一步增大。


                              IP属地:陕西15楼2024-08-22 16:35
                              收起回复