首页 > 范文大全 > 正文

大数据和数据化思考

开篇:润墨网以专业的文秘视角,为您筛选了一篇大数据和数据化思考范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

“当数字拥有说话的能力时,便也可以做到语言能做到的事情,比如小说、戏剧、诗歌。这样的数字不仅仅诉说着有关棒球的故事,它讲述的还有性格、心理、历史、力量、优雅、荣耀、牺牲、勇气、沮丧、连贯一致、运气不济、雄心壮志与成功失败。”一位不得志的作家比尔·詹姆斯在自费出版的书《1985年棒球摘要》中写道。他是个狂热的数据迷,但只是对棒球数据感兴趣。

《1985年棒球摘要》和比尔·詹姆斯能够被人们在今天重新提及,是因为这本书启发了一位名叫比利·比恩的棒球队总经理。比利·比恩借用了比尔·詹姆斯对于棒球的思考方式,即用数据而不是靠经验与直觉来判断一位球员的价值,然后以这种理念组建自己的球队。结果,奥克兰运动家队,这支2002年时薪金总额只有纽约扬基队三分之一的棒球队,创造了常规赛季成绩联盟第二的奇迹。这个故事被美国商业作家迈克尔·刘易斯写成了书,并在2003年出版。然后,这本书又在2011年被拍成电影,还获得了当年的奥斯卡奖。电影和书的名字都叫《点球成金》。迈克尔·刘易斯在书中这样写道:“如果对一个人价值的错误评估可以发生在棒球场上,发生在球场上三万多观众的眼前,发生在电视机前几百万观众的眼前,那么,其他行业里的评估标准又有多少是准确公平的呢?”

事实上,当《点球成金》热映时,一个词汇已经开始在商业世界流行:大数据。

什么是大数据?《纽约时报》说:它是一个营销术语,也是技术领域发展的一个趋势。大量的新数据不断涌现,以每年50%的速度增长。原因是由于今天传感器和微处理器无处不在。“所有的机械或电子设备都可以留下数据痕迹……这些设备和使用它的人,通过互联网交流,又形成另一个庞大的数据源。当这些数据和来自其他媒体、无线或有线电话、有线电视、卫星等来源的数据结合时,更加显得庞大。”哈佛商学院访问教授托马斯·达文波特说。与数据打交道的数据科学家已经成为硅谷最炙手可热的职业。达文波特在《哈佛商业评论》中称数据科学家“集黑客和定量分析员的优势和特长于一身,非常短缺”。

Jeff Hammerbacher即是一名数据科学家。他在2006年离开投行贝尔斯登加入Facebook。马克·扎克伯格交给他的任务是,找出为什么Facebook在有些学校很成功,在另外一些学校却不那么成功的原因。他创建出一套分析技术,这套技术后来用于Facebook的在线广告业务。它对用户进行跟踪研究,然后对收集到的大量数据进行分析,了解人们的社交、行为和消费习惯,再以这些数据来赚取广告收益。2008年时他离开Facebook。在接受《彭博商业周刊》采访时,他说了句很著名的话:“想一想我们这一代最聪明的人都在研究怎样让人点击更多的广告,真是糟糕透顶。”

大数据除了能让棒球队赢球和让如Facebook和谷歌这样的公司卖出更多的广告之外,还能做什么?举例作答,比如人工智能。谷歌的搜索技术如此,它的无人驾驶汽车也是如此。无人驾驶技术需要收集大量的数据,迅速对之做出解析,然后做出决策。苹果的Siri也是大数据应用的一个例子。

比如医学领域。Hammerbacher创建的公司Cloudera正在开发一种能够分析大量数据的操作系统。这位数据科学家认为它可以用于医学领域,“同在Facebook上问一群朋友最喜欢什么不同,这里的问题是‘那些癌症病人都有哪些相同的基因’。”数据科学家们可以帮助医学研究者绘制不同基因、器官的生命系统关系图,然后推导出这些关联怎样导致疾病出现,从而对症下药。

另外一个广泛的应用则在于电子商务领域。对于消费者购物习惯数据的分析,可以让电子商务公司做到精确推荐关联产品、管理库存和快递运输服务。而且,开放这些数据还可以传导到传统的制造商对产品的设计、制造和销售,从而让消费者更快地对生产者产生影响。

艾伯特-拉斯洛·巴拉巴西的书《爆发》也同数据和数据化思维相关。巴拉巴西把迈克尔·刘易斯的逻辑进一步向前推进,推进到让人感到有些极端的程度。坦白说《爆发》读起来相当无趣。巴拉巴西的逻辑是,人类行为看似杂乱无章,其实有规律可循。当然,要想发现这些规律,你得搜集大量的数据,然后再对这些数据做出分析。通过对一些数据和行为的分析,巴拉巴西得出的结论是,人类的行为,而且不止是人类的行为,都存在一个爆发模式。无论是人们通过写信联系时回信的模式,还是今天人们回复电子邮件的模式—“每个用户的电子邮件模型都跟我的差不多,它们充满了爆发点,就像暴雨频发的夏末天气,在狂轰滥炸般发送了大量邮件之后,总会有长时间的沉默”,巴拉巴西说。

这就是列维模型。先是不起眼的、小范围的活动,接着就是剧烈的长途跋涉。巴拉巴西举出了各种例子,信天翁的飞行如此,人类眼睛在捕捉新画面时也是如此,先在一个小范围内漫游,然后突然转移到一个远点。科学发现也如此,爱因斯坦发表三篇论文的1905年就是一个科技爆炸年。地球和人类进化也是如此。在巴拉巴西的“爆发”统治的世界中,“我们经常会夸大自己和别人的不同,总以为自己的生活与周围的人相比要更规律或更不规律。然而,事实上,不管你是艺术家、会计,还是CEO,一旦将你的日常生活量化,你的可预测程度和你的邻居相差无几……我们的行踪都深受规律影响,而它的影响力比我们想象中要大得多。”我们的爆发性“看上去很随意、很偶然,但却极其容易被预测。”

这种结论要是放在更大的范围内去讨论,定然会让人不屑一顾。难道人类的历史还不足以证明不确定性不仅无处不在而且根本无从预料吗?大数据和数据化的思维方式真的能战胜不确定性?

因此,毫不奇怪,在《点球成金》中,认识到了数据的威力、用数据化思考来代替经验思考的棒球队总经理,面临的几乎是来自整个团队的压力。经验丰富的教练和球探认为自己这么多年的棒球生涯才是最重要的判断依据,而不是一个数学系高材生在电脑上收集到的那些数据。同理,对于其他人而言,即使是认识到了“大数据”和数据化思考的重要性,接下来也是困难重重的。

《哈佛商业评论》的一篇文章说:“大数据的技术挑战显而易见。但其带来的管理挑战更为艰巨—这要从高管团队的角色转变开始。”传统的企业决策模式非常简单,即由职务最高的管理者来承担主要的决策职责。这种模式被称为“HiPPO”模式,即高薪人士的观点(the highest paid person’s opinion)。《哈佛商业评论》说:“的确有一些资深高管忠实于数据,一旦数据否定了他们的直觉,他们会抛弃个人观点。但是我们相信,在今天的整个商业世界中,人们仍然更多依赖个人经验和直觉做决策,而不是数据。”

这正是两种思维方式的冲突。一种思维方式认为通过建立庞大的数据库和对数据库的分析,可以建立起一种预测未来的模型,无论是哪种未来。这种思维方式成功过也失败过。成功的例子是“点球成金”,失败的例子是长期资本管理公司。另一种思维方式则是,根本不存在所谓可预测模型,因为我们生活在不确定的世界,被随机性统治。不过,只要是人类搜集数据的能力和分析数据的能力在不断进步,前一种思维方式也就会不断出现,多少次失败也不足以遏制住这种念头。