财新传媒

大数据分析破解制胜密码

2013年09月04日 19:15 来源于 财新网 | 评论(0

  大数据火了一年多,现在人们对这个概念已经不陌生,但是到底如何发挥大数据的威力,为自己的业务所用,讨论得还很不深入。大数据的讨论不能总是停留在“有趣的发现”“啤酒加尿布”和成功创业故事层面。现在应该问一问,大数据能帮我做点什么?

  大数据的一个重要意义,在于帮助我们认识和理解复杂系统的运行,通过分析把握复杂系统中原先我们所忽略的、不知道的重要规律。

  现在无论是在商业经济领域还是社会领域中,人们面对的系统比以前复杂了很多,各种因素千头万绪,相互交织、相互影响,要达到目标,需要把握关键问题,然后集中力量解决,也就是所谓的“把握主要矛盾”,“集中优势兵力各个击破”。

  道理很简单,实践起来特别难。难就难在无法判断什么是“关键问题”和“主要矛盾”。任何一个组织的决策者和领导者,最重要的工作就是判断主要问题在哪里,然后分配优势资源去解决问题。但直到不久以前,绝大多数的决策都是依靠经验来分析和判断,具有很大的偶然成分。而大数据分析就可以帮你理解复杂系统的脉络,把握关键点,改变你的决策和行动。

  网球可能是帮你理解大数据分析的最好范例。

  跟其他体育项目一样,网球也涉及大量的数据。一发成功率、一发得分率和Ace球是标志球员竞技水平的关键指标,发球速度、接发球成功率、上网成功率、得分点则突出体现了球员的打法特点,如果非受迫性失误和双发失误率上升,那表明球员的心理状态或者体力开始下滑。这就是网球中的数据。

  但是在当两个选手对阵的时候,哪几项指标才是决定胜负的呢?如果能够预先了解到制胜的关键点,那么就可以有针对性地安排战术,并且在比赛中随时调整。

  这就是大数据分析能够办到的事情,也是只有大数据分析才能够办到的事情。IBM赞助网球赛事并提供技术支持始于1993年,从2005年以来,IBM通过SlamTracker追踪了四大满贯赛事八年来的全部 8128 场比赛,收集4100万个数据点,动用5500个分析模型,在45个潜在动态指标里选择、对比、分析、判断、猜测、排除、定位、评估、定量、组合,在每场比赛中为对阵双方的选手找到三个获胜的关键指标。比如说,在今年法网男单决赛中纳达尔对阵费雷尔的时候,纳达尔的三个获胜关键指标分别是接对方一发的回球得分率、一发得分率和相持4到9回合的赢球率,而费雷尔的三个获胜关键指标分别是相持4到9回合的赢球率、二发得分率和非受迫性失误。Keys to the Match不但找到了这三个关键的指标,而且找到了量化的及格线。比如纳达尔在上述三个指标中的及格线分别是44%、64%和48%,而费雷尔的三条及格线分别是52%、60%和19%。如果在这三项指标里纳达尔比费雷尔完成得更好,那么纳达尔获胜的可能性就大大高于后者。事实上,6月9日的比赛也确实如此,纳达尔在这几项关键指标中都达到或超过了及格线,取胜也就是情理之中了。

slamtracker02 
2013年法网男单决赛的 Keys to the Match 界面

  这三项关键指标并不都是司空见惯的普通指标。例如,相持4到9回合的赢球率,接对方一发的回球得分率,这些都不是随便能在电视直播的屏幕上找到的指标。不要说是普通球迷,就是最资深的网球专家,如果仅靠平时的观察和手工的分析,也很难找到这些关键指标,并且把它们按次序的重要性排好。至于为每一个指标设定一个及格线,那更是不可思议的事情。

  这正是大数据分析的能力和优势所在。大数据分析从大量的数据中寻找相关性模式,发现以前不为人知的、超越于平凡知识之上的、至关重要的新知识。这样的新知识,是隐藏在表象之下的获胜关键,是决定竞争结局的密码,是价值,是财富,是自我实现之路。这才是为什么那么多商业界的有识之士狂热追捧大数据的原因所在。