大数据显示:巴西将夺得2018世界杯冠军 靠谱吗?

来源:网络时间:2018-06-12 14:02:55

  2018年俄罗斯世界杯将于6月14日正式拉开帷幕,而随着赛事日期的日渐临近,坊间对于本届世界杯冠军归属的预测和争论进入到了白热化的阶段,不光是球迷在为自己钟爱的球队摇旗呐喊(阿根廷是冠军!!!),就连平时非常高冷的商业组织也都投入到这种狂热中。

  最近,著名的投资银行、投资管理公司高盛发布了一个他们对于“2018年俄罗斯世界杯冠军”的分析预测。当然,有别于球迷的“情感预测”,高盛的预测显得更加理性和具有依据——高盛运用了高深的大数据技术,使用了20万个统计模型,包括单个球员的数据,到近期巴西队的表现,再到100万次的模拟比赛,从而得出巴西将赢得俄罗斯世界冠军的结论。顺便说一下,高盛的大数据模型认为,法国将夺得亚军,德国屈居季军,葡萄牙第四,而阿根廷无法进入四强(别哭,阿根廷)。

  很酷,是吧?这感觉就跟《复仇者联盟3》中奇异博士用时间宝石看遍了14000605个无限战争的结局,只有一个未来的结局是复仇者联盟取得了胜利。今天,大数据发挥的作用就跟电影里的“时间宝石”一样吗?能够准确预测未来?!

  先来看一个大数据成功发挥作用的案例:2009年全球首次出现甲型H1N1流感,由于是新型病毒,没有对应的疫苗和药品,而且传播速度很快,短短几周之内引起了全球的恐慌。面对此次流感,各国的公共卫生机构在“如何预防H1N1传染”上而临巨大压力,预防的核心是要准确预测病情的蔓延程度。但现实的情况是,初期感染了H1N1的人们并不会马上去医院检查,大部分人都实在撑不下去了才会到医院求医,医生发现新型流感病例后,会通报给疾病控制与预防中心,最后由中心汇总统计各地的情况,这个过程大概需要两周时间,这毫无疑问是严重的信息滞后,这将给流感疫情的把控和抑制带来非常不利的影响。这时候,大数据发挥出其神奇的预测的功能。

  谷歌的数据分析师分析了几十亿条关于流感的检索记录,处理了4.5亿个不同的数字模型,构造出一个流感预测指数,非常神奇,这个预测指数与官方数据的相关性高达97%,准确地预判了H1N1流感的发展趋势和爆发的地区,比政府的官方播报提前两周,有力地协助卫生当局控制流感疫情。事实上,谷歌的数据分析师并不懂医学,也不知道流感传播的原理,但是他们借助大数据技术为工具,准确地预测了一场极其复杂的大型流感疫情的发展的全过程,这是一件非常神奇的事情。

大数据显示:巴西将夺得2018世界杯冠军 靠谱吗?

  今天,不懂足球,最起码并非足球专业领域的高盛的数据分析师们,能否通过大数据准确预测本届世界杯冠军呢?

  事实上,我认为这个很难。即使到最后,巴西一如预测中夺得了世界杯冠军,我也不认为这是大数据的功劳。

  为什么呢?

  因为大数据本身不是一种逻辑推理研究,它发挥作用的基础是对数量巨大的数据做统计性的搜索、比较、聚类、分类等分析归纳,以探求不同因素间的相关性,如上述流感案例中,某地区人们在Google.com上搜索关键词“流感”次数越多,则该地区可能大规模爆发流感的可能性越大,这是一种客观事实,只是通过大数据把这种相关性给“暴露”了出来。“相关分析”的目的就是找出数据集里隐藏的相互关系网(关联网),一般用支持度、可信度、兴趣度等参数反映相关性,但这些不同的因素间并不存在逻辑上的因果关系,甚至这种因果关系是恰恰相反的,就如,不是因为你搜索了“流感”这个关键词,所以你才感染了H1N1。

  而世界杯一共有32支来自各国的参赛队伍,一共进行64场真刀真枪的较量,才会决出最后的冠军,所以,要准确分析预测最后的冠军并不是一件容易的事情。因为这都还不是客观的存在的事实,还等待着发生,里面充满着各种难以预测的意外,如,谁能预测到1998年世界杯决赛前发生在罗纳尔多身上的一切,导致大罗全场如同梦游,直接一场惨败丢掉冠军?谁又能想到2006年世界杯决赛第109分钟,齐达内毫无征兆地突然用头撞倒了马特拉齐,然后直接被红牌罚下,这张红牌直接改变了场上形势,此前法国已经掌握主动,很有可能完成致命一击,而最后意大利偷走了最后的冠军。

大数据显示:巴西将夺得2018世界杯冠军 靠谱吗?

  这些都不是大数据能够预测的,大数据擅长的是相关性预测,而对人类的情感、冲突、为了利益不择手段等等,大数据无能为力,因为数据库里没有一条数据会记录马特拉齐会突然骂齐达内“你是意大利养出来的一条忘恩负义的狗”。

  足球是圆的,正是无法预测,这才是足球的魅力。

  当然,如果哪一天,大数据能分析出中国将夺得世界杯冠军,而中国到最后果真赢得了冠军,那时候,我非常愿意相信大数据的神奇魔法。

文章内容来源于网络,不代表本站立场,若侵犯到您的权益,可联系我们删除。(本站为非盈利性质网站) 联系邮箱:9145908@qq.com