财新传媒

数据科学家浮出水面

2013年09月30日 16:18 来源于 财新网 | 评论(0

  王阳 IBM全球副总裁兼IBM中国开发中心总经理

  吴静 财新记者

  【对话背景】

  一个正在玩网络游戏的用户,并不知道他与数万计用户的选择偏好,都被记录并形成数据分析,反映到公司财报里;一个在服装店左挑右拣寻找更适合自己款式的女士,并不知道她的喜好影响着几天后上柜的货品,某款存量可能增加,而某款可能悄然消失。

  这些藏在消费行为背后的数据,已是各路商家追逐的目标。

  谁能发现这些数据的秘密?现在有个新名词——数据科学家。斯卡特(Schutt),纽约Johnson实验室进行启动项分析的研究科学家,兼任哥伦比亚大学统计系助理教授,认为成功的数据科学家具备两类特点:一方面,许多人拥有博士学位,研究领域一般与数量科学相关,有与生俱来的编程能力,善于用探索数据的方式看待周围世界,把蕴含在数据中的规律建议给产品经理们,从而影响产品、流程甚至决策;另一方面,成功的数据科学家都是思想家,拥有好奇心,充满想象力并喜爱创新。

  有很多其他学科的人才正进入数据科学家领域——比如物理、音乐、社会学等,他们也许对计算机科学知之甚少,却懂得如何运用与众不同的方法看待大数据。

  越来越多的中国公司设立了“首席数据官”(CDO)的职位,将数据开发上升到公司战略地位。如何挖掘和利用数据资源,哪些人能更好地执行使命?专于此行的IBM全球副总裁兼IBM中国开发中心总经理王阳,在近日接受财新记者专访时做出了生动的阐释。

  【对话摘登】

  财新记者:现在业界对大数据问题仍存在一些争议,像Facebook就认为,大数据是个被热炒的噱头。传统行业对此可能更加陌生。如何理解大数据的价值?中国企业对大数据运用的情况如何?

  王阳:过去50年来,信息技术推动了整个人类社会和生活方式的变革,而大约每隔15年-20年,信息技术就会有一次重大突破。自上世纪90年代互联网变革至今已有20年,大数据将是信息技术下一次重大突破的重要方向之一。

  具体到中国来看,大数据也已经进入实践阶段。根据IBM与牛津大学的联合调研,56%的中国企业正在计划部署大数据,25%的中国企业已经开始进行大数据实践。我们相信,对于大数据,中国面临前所未有的机遇,有望在这一领域引领全球技术发展趋势。

  大数据的关键价值是如何从海量数据里挖掘有效信息,这些信息才是企业重要的战略资源。比如说零售业,通过大数据分析,零售商可以实时掌握销售动态,迅速调整库存,同时准确了解客户需求,制定更精确的营销计划,实现“以客户为中心”的商业转型。这些都将深刻改变传统行业的运作方式,大幅提高运作效率。

  大数据会在中国经济转型中发挥越来越重要的作用。比如解决城镇化面临的住房、教育、交通等难题,大数据分析都会有价值。通过对交通流量数据的实时采集和分析,可以指导驾驶者选择最佳路线,改善城市交通状况;通过大数据的分析,推动钢铁、零售等传统产业的升级;另外,还可以帮助中国在发展战略性新兴产业方面迅速站稳脚跟,巩固并提升竞争优势。所以,无论从微观层面还是宏观层面,大数据都是一种战略性资源。

  财新记者:从海量数据中提取有用价值,其中的关键因素还是“人”。你认为,哪些人才是这一领域最需要的?

  王阳:大量存在的数据,就像未被开采的石油,需要那些具备采集能力的专业人员,我们称之为“数据科学家”。数据科学家需要具备深入的分析能力,并且对大数据有独特悟性,他们已经成为非常抢手的人才。

  这些人才的特征是——一半科学家,一半思想家。数据科学家要对商业发展具备洞察力,能够通过数据推理,解析被掩盖的事实和趋势。数据科学家能够把大量散乱的数据变成结构化的可供分析的数据,还要找出丰富的数据源,整合其他可能不完整的数据源,并整理成结果数据集。

  数据科学家同时拥有好奇心,能坚持,并且充满道德感和正义感。他们是头脑灵活的思考者,鼓励提问,思维和沟通需要高度清晰和精准。而且,数据科学家喜欢发现事物中的幽默之处,并且往往是良好的倾听者,能够对其他人的需要感同身受,从而能够敏锐地捕捉商业需求。

  财新记者:这样的人才是否非常紧缺?

  王阳:是的。现在越来越多的中国企业设立了CDO职位。随着大数据继续在垂直领域的企业中发挥作用,市场对相应人才和CDO的需求也越来越大。

  从IBM自身来看,就非常重视在全球网络培养数学、数据分析精英。IBM还打算与全球1000多所大学合作,构建一个输送数据科学家的“通道”——IBM学术计划,包括访问大数据和分析软件,专业课程以及由数据科学家参与的大学讲座等内容。美国乔治敦大学、西北大学、密苏里大学、新加坡国立大学都已经开始了这一项目。

  未来,数据科学家将越发活跃在商业世界,也将致力于解决许多工业和学术领域的问题,比如,生物医学研究、信息学、疾病预防、政府、教育以及城市规划等。下一代数据科学家将帮助改进公民的生活质量,加深经济和社会对人类行为的理解。社会应该致力于鼓励有前途的学生成为下一代数据科学家。

  财新记者:如何通过大数据服务,帮助企业实现商业转型?

  王阳:目前,企业发展面临着全新的机遇和挑战。谁能更快地从“以产品为中心”转向“以客户为中心”,整合所有与消费者接触的渠道,挖掘消费者变化背后酝酿的新商业模式和机会,更好地抓住并满足消费者个性化的需求,谁才能赢得未来。

  目前在全球范围内已有过万级的客户在利用IBM的大数据与分析能力,从海量数据中获取价值,把大数据转为企业敏锐的洞察力,驱动业务的长足发展。比如作为墨西哥最老和最大的银行之一,Banorte银行意识到将客户视为独立个体了解,并服务每一个客户,是未来增长的核心。这家银行在前端业务进行了大量投资,从每一个系统、流程到人员都充分接触到客户,可以更好地预测、响应并利用未来的活动来快速获取价值,这帮助了它领先于竞争对手。

  企业需要转变传统的了解和服务客户的方法,需要在已掌握的客户数据中分析挖掘并深刻洞察,从而根据客户的独特偏好、以及在特定时间点针对客户进行服务,实现个性化营销,以此取代通用的产品和服务。

  财新记者:大数据对竞技体育的改变也是个典型的例子。请你分析一下这种改变是如何发生的?

  王阳:以网球四大满贯赛事为例。IBM和四大满贯合作的历史超过20余年。2008年,英国温布尔登引入了SlamTracker平台,采集了大满贯8年的历史数据,分析了4100万个数据点,采用了5500个数学模型来为每个球员的每场比赛制定三项制胜关键指标(Keys to the Match),要想获得胜利,必须努力完成这三项指标。

  对球员和教练而言,这种数据分析方式有助于在赛前进行有针对性的部署,以及赛后总结。而对球迷而言,不仅仅通过数据分析平台实时把握比赛进程和重要比分,还可以通过查找自己关心的数据,了解比赛背后的各种细节。

  在今年的美网中,更多中国观众在用SlamTracker观看比赛,尤其是李娜的比赛。我们捕获实时数据,并结合历史比赛数据进行分析,同时及时提供给媒体,为媒体播报比赛提供了全新的方式。

  根据IBM监测到的数据显示,在2012年温网男子决赛期间,和温网有关的Twitter每秒有超过100条之多。2013年9月份的温网期间,有一项创新就是通过IBM的技术,监测twitter和facebook等社交媒体平台的公共舆论,这样公众感兴趣的话题、市场的品牌趋势便一目了然,对于赛事主办方而言,更有利于其制定合理的安排以满足球迷的需求。