宇宙吧 关注:761,028贴子:6,272,528

一个非常难的问题,呼叫大神

只看楼主收藏回复

现代是大数据时代,很多企业都在利用人工智能,对历史数据进行统计分析,期望能预测未来,把握先机。
但在实际操作中,却是非常困难:
最困难的一个问题是:严格来说,世界上不存在同类事件,比如丢硬币,丢硬币的人一不样,丢硬币的力不一样,都会得出完全不同的概率。还有世界杯,现场解说总喜欢说:“二队历史交锋七场,主队四胜三平,
那么主队应该不会输。”问题是,场上踢球的人都不一样了,那些历史数据有参考的意义吗?
以上:这个世界上,根本找不到严格意义上的同类事件,统计分析的数据,去预测不同事件的概率,有卵用?
严格意义上的同类事件,我们找不到,那么我们找,我们认为的相似事件(这样会造成差之毫厘谬以千里):
这是某个幼儿园做的真实实验:
我们把这些小孩子,以性别、年龄、性格、亲子关系、学习成绩等等我们认为相似的情况,
把这些小孩分成七类人。
其中人数最多的一类,有一百人。
然后我们把这一百人,分成五组,每组二十人。
让他们回答:如果父母吵架,是劝解,还是不管,或是帮父或母……三选一
第一组,二十小孩:有3人选择劝解,有5人选择不管,有12人选择帮父或母
第二组,二十小孩:有1人选择劝解,有2人选择不管,有17人选择帮父或母
那么按这个趋势,这类小孩,我们就可以推理出,第三、四、五组,选择帮父或母肯定是大多数。
但事实却是错误的!
第三组,二十小孩:有11人选择劝解,有3人选择不管,有6人选择帮父或母
第四组,二十小孩:有7人选择劝解,有8人选择不管,有5人选择帮父或母
已经做了四组实验了,那么如何正确推理预测出第五组会出什么情况?选那个的人最多?
事实是,第五组,二十小孩:有6人选择劝解,有9人选择不管,有5人选择帮父或母
真是乱七八糟的,根本没法,我们的分类肯定有严重问题,这一百人,根本就不是一类人!但就算是一类人,他们就会作出同类的选择吗?
用什么方法?如何才能把会作出同类选择的小孩,在小孩作出选择以前分类出来?


1楼2018-07-03 16:30回复
    感觉,像这样的问题,根本就不是人类的能力,可以解决的,只有神知道,如果世上有神的话!!!


    2楼2018-07-03 16:34
    收起回复
      大数据不是万能的。只有钱是万能的。


      来自手机贴吧3楼2018-07-03 16:40
      收起回复
        数据只能说有参考的作用


        来自手机贴吧5楼2018-07-03 16:54
        收起回复
          把你儿子全改造成机器人


          6楼2018-07-03 17:25
          收起回复
            就能解决


            7楼2018-07-03 17:25
            回复
              数据的作用是经验的总结,虽然未来不可测,但数据能总结过去的一些重复发生较多的,以达到预测未来,就是大家都知道乌云很大机会下雨,虽然不是一定会下,但历史数据告诉我们,这是下雨的预兆


              来自手机贴吧8楼2018-07-03 17:27
              收起回复
                类似事件推测可能性。比如小明每天都5点到6点回到家,风雨不改,那么就可以推测未来几天都是大概率在这个点数回家,但不能确凿肯定必定在那个时间段(17:00-18:00)回到家


                IP属地:广东来自Android客户端9楼2018-07-03 17:33
                收起回复
                  心理学不是那么好量化,所以通过数据分析也只能得出一个概率结果不一定是真实答案。


                  IP属地:山西来自Android客户端10楼2018-07-03 19:31
                  回复
                    数据多了就用第六感


                    11楼2018-07-04 06:41
                    回复
                      或许您对统计学和大数据都有误解。大数据就是所有能收集到的数据,而统计是需要清楚地找出对于目的有间接证据的数据。例如财务公司是如何决定您的信贷额度的呢?它们的计算机收集处理的信息可不少,例如您网上购物的两个最常用的到货地址(一个是您的住所,一个时您的单位)这两个地址基本上能确定您大概的社会地位,会结合在这两个地址活动的人的信贷额度取得一个平均值;计算您每天行程,路径,经过红绿灯时是在什么时间间隔停下,结合您的油卡消费频率和电费单,大概就知道您开什么车……相类似的情况得出一个人无法处理的海量数据然后得出一个平均值就得出您的信贷额度了。这样得出的数据惊人地让财务公司规避掉许多风险。现实世界中有一个真实例子,沃某马超市曾经通过大数据对一位17岁的少女推送婴儿用品广告,而且很频繁。当少女的父亲看到女儿手机的推送广告过于频繁时,这位父亲把这个超市告了。但是不久后这位父亲发现自己的女儿真的怀孕了(在此前她女儿甚至没去过医院做检查),后来这位父亲撤销了对超市的诉讼,并到当地的超市找到经理道歉,经理一脸懵逼跟这个父亲说,这是系统通过大数据决定推送那些广告的,其实谁都不知道它推送些什么。


                      来自iPhone客户端12楼2018-07-04 09:32
                      收起回复
                        可以去了解一下阿法狗,zero是脱离人类棋谱自己去训练的。mastr是基于人类的棋谱训练的。大数据不一定是你想象这样用的。
                        练出来的AI,水平跟人类差不多,已经叫有参考价值了。


                        IP属地:广东来自Android客户端13楼2018-07-04 12:34
                        回复
                          关于小孩,问题得不到答案肯定是有原因的,找一找原因,第一,分类是否科学无漏洞。第二,样本量是否充足避免偶然性。第三,取样方式是否就地取材导致结果走样。首先你这个例子样本量太小哦,还够不上所谓的大数据。然后呢,分类方法也不严谨嘛


                          IP属地:吉林来自iPhone客户端14楼2018-07-04 12:59
                          收起回复
                            第一你小孩的例子不是大数据,第二小孩的例子只是证明了这种分类是错误的,根本无法解决小孩选择的问题。 人类的选择是一个非常复杂的过程,不是靠单纯的分类就可以总结出来。


                            IP属地:中国香港来自iPhone客户端15楼2018-07-09 02:12
                            回复