登陆注册
16592500000023

第23章 有趣的大数据运用(1)

大数据下的地震预测

实现准确预测需要一些真实的因素。我们必须掌握足够多的历史数据来识别模式——与这些模式相关的事件必须始终发生。

而且我们必须有区分疑似事件和真实事件的能力,即众所周知的排除误报。但是,仅仅是准确预测还远远不够。要让预测派上用场,我们还必须具备根据预测及早并快速采取行动的能力。

比如,当地震真正发生的时候,相关数据会非常清晰地表现出来,例如地动山摇。而且一旦其威力够大的话,停电、爆炸、有毒气体溢出、火灾爆发都可能出现。当然,到那个时候,也就不再需要大量的计算机和天才科学家们来预测灾祸了。

所以数据要起到效用,当下的数据必须预先与过去的数据进行匹配,而且要给我们留下足够多的行动时间。如果在地震发生的前几秒才完成匹配的话,也就没什么作用了。我们需要足够多的时间得出结论、调动各方资助力量并疏散群众。而且,我们必须具备快速分析数据的能力,只有这样,数据分析才能发挥效用。试想一下,假如我们拥有足够多的数据,它们能让我们提前一天预测到地震的发生,而我们却花费了两天时间进行数据分析,那这些数据和我们的预测结果就起不到什么作用了。

因此,从本质上来说,准确预测地震既是大数据的机遇又是挑战。单纯拥有数据还远远不够。我们既要掌握足够多的相关数据,又要具备快速分析并处理这些数据的能力,只有这样,我们才能争取到足够多的行动时间。越是即将逼近的事情,越需要我们快速地实现准确预测。不过,在某种程度上,这种预测适用于收益递减规律。就算我们能在瞬间完成对预测地震所需的海量数据的分析处理,如果没有留下足够的时间将群众调离危险区域,这种分析就没什么意义。

2012年10月22日,6名工程师因为在预测地震时误导村民,均被判处有期徒刑6年。这次地震发生在2009年的意大利拉奎拉镇,300名村民因此丧生。那么,大数据能帮助地质学家实现更好地预测吗?

每年,世界各地约有7000次里氏4.0或更高级别的地震发生。

地震测量有两种,一是著名的里氏震级,二是更现代的矩震级。

前者是依据地震所含的能量定级,而后者是通过地震所释放的能量认定地震等级。预测地震的时候,有三个关键问题必须找到答案:何时、何地、何种震级?

在《庸医游戏》中马修·玛贝认为,虽然地震有预兆,但是我们仍然无法通过预兆可靠、有效地预测地震。相反,我们能做的就是尽可能地为地震做好准备——它的发生频率远比我们想象的要大得多。这些准备包括在设计、修建桥梁和其他建筑的时候就把地震考虑在内,并且准备好齐全的地震应急包,一旦发生大地震,这些基础设施和群众都能有更充足的准备。

我们知道,地震是由构造板块相互挤压造成的——构造板块则是偶尔会漂移的陆地板块。这种板块挤压发生在地球深处,而且各个板块的相互运动复杂难懂。因此,有用的地震数据来之不易,而要弄明白是什么地质运动导致了地震,基本上是不现实的。

归根结底,准确地预测地震,即回答何时、何地、何种震级这三个问题,需要掌握促使地震发生的不同自然因素,以及揭示它们之间复杂的相互运动的更多、更好的数据。

大数据的关键之处正在于此:预测不同于预报。科学家能预报地震,但是他们无法预测地震。1906年旧金山发生地震,导致3000余人伤亡,而其何时会再次遭遇这样的地震?其实,科学家们只能预报某个地方、某个具体的时间段内发生某级地震的可能性。例如,他们只能说未来30年,旧金山湾有80%的可能性会发生里氏8.4级地震,但他们无法完全确定地说出何时何地会发生地震,或者发生几级地震。这就是预测和预报之间的差异。

不过,虽然准确预测地震还有很长的路要走,但是黑暗中尚有一线光明,那就是,科学家已经越来越多地为地震受害者争取到几秒钟的时间了。

传统的地震探测仪需要花费3000美元甚至更多,而如今基本的地震探测只需通过连接至标配计算机的廉价的探测仪就可实现,甚至只需通过使用如今很多移动设备内置的动作感应功能就可实现,而这些功能原本是为了导航和游戏设计的。

斯坦福大学的“地震捕捉者网络”由参与分布式地震检测网络的大约200个志愿者的计算机组成。有时候,这个监测网络能提前10秒钟提醒可能会受灾的人群。也许10秒钟看上去不长,但是却很重要,因为这意味着你是搭乘运行的电梯还是走楼梯,是走到开阔处去还是躲到桌子下面。

“地震捕捉者网络”就是一个会生成大量数据的廉价监测网络的典型例子。以前,要捕捉和存储如此多的数据耗资巨大,但是,近期的技术进步使得这些数据的捕捉和存储成本大大降低。

有时候甚至比过去便宜了9成都不止。

是什么方便了我们的出行

10年前,大学生吴中亚第一次来到北京旅游。他带着激动的心情,打算参观故宫、天坛、颐和园、圆明园和众多的博物馆。

不幸的是,下火车后他和同伴走散了。两个人都没有手机,没法联系上,钱也在同伴身上,吴中亚傻眼了。同伴对北京很熟悉,所以此前吴中亚根本没做什么准备,他是想一路和同伴一起的。

现在,他要一个人到他们定好的旅馆与同伴会合。该怎么办呢?

他一个人很费劲地研究着地铁线路,好半天之后,他放弃了,决定还是问路。北京的大爷大妈们很热情地给吴中亚指路,“你往东走200米,在那个胡同那儿往南拐,再乘坐……”“你往北走,那边有一个天桥,你走到天桥北边然后往西,再坐……”吴中亚从来都不知道东南西北,面对各位大爷大妈的热情和不一致的指导,吴中亚还是不知道该怎么办。最后,吴中亚在报刊亭买了份地图,终于解决了问题。

地图真是一种非常有用的东西。吴中亚在地图上查看了公交和地铁的线路,顺利地找到了旅馆。地图上,每条地铁线路的颜色都各不相同,还可以在上面看到线路交叉的站点,如此一来,要知道在哪里换乘,就很容易了。可以说,就因为一份地图,弄清楚怎么走路突然之间变成了一件轻而易举的事情。

10年后,吴中亚再次到北京旅游。马虎的他出行前又没怎么规划,这次他有了经验,一下火车就买了份地图。他在地图上找了很久,还是没找到他要去的那个地方在哪里。没办法,他直接叫了一辆出租车。出租车司机是个新手,碰巧吴中亚要去的那个地方他完全没听说过。吴中亚一听急了,准备下车,司机却毫不着急,让他稍等。然后,司机不慌不忙地从口袋里拿出手机,依次打开了GPS定位功能和电子地图软件,将吴中亚要去的地方输入软件里,软件很快生成了一条线路,然后司机很顺利地根据线路开到了目的地。

吴中亚的这两次经历,告诉了我们什么呢?

第一次经历,吴中亚开始虽然有大爷大妈给他指路,却还是怎么都搞不清楚路线,后来借助一份地图就搞清楚了。因为大爷大妈非常口语化和个性化的指路,对于置身陌生城市的吴中亚来说,还是很难量化成具体线路,而地图犹如一份完整的有关公交、地铁、建筑的数据,有着非常精细的描绘和统一的量化标准。只要弄清楚地图是怎么查看的,吴中亚找到旅馆的可能性就大了很多。可是,为什么第二次经历,吴中亚还是拿着那份地图,却找不到位置了?因为随着中国各地经济建设的迅猛发展,各个城市的面貌在迅速发生着变化,地名也一样。可能一夜之间,很多老地方、老店铺消失了,很多新地标、新建筑诞生了,而地图的发行从勘察到印制要经历很多个环节,这些环节让地图永远跟不上城市的变化。而出租车司机使用的地图完全不一样,它是互联网地图。互联网地图具有实时性,哪个地方的线路和地名有了变化,网络地图上就可以直接呈现出来。

现在,出门前和路途中的人们问路越来越少,很多人都直接通过手机地图查询到目的地的线路。而且,手机地图已经越来越超出传统地图的功能定义。比如百度地图,既具有查地点路线、卫星导航等几乎“不值得一提”的常规功能,更具有一些超乎想象的便利功能,比如百度地图可以告诉你附近哪里有公厕、快餐、自助取款机和加油站,可以告诉你离你300米的某个商场正在举行一场女装三折特卖、楼下的餐厅在搞中餐六折大促销、1000米远的写字楼里有家公司在招聘员工、楼上有一套房子在招租、某某街道刚发生车祸并有某帅哥在现场发回的照片等等。细加辨别,不难发现,百度地图有个非常重要的特质就是:百度是在做一个微地图,以满足用户方方面面的需求,包括各种生活细节的服务。从总体功能上看,百度地图不再着眼于地图线路及覆盖范围,更不是侧重于导航,而是用大数据来支撑细分的本地生活服务。

电子地图相对于传统地图最大的优势是什么呢?答案自然是大数据。大数据是手机地图的绝对优势,数据量的大小直接决定了地图的详细程度和能够提供服务的多少。而且,电子处理的是全互联网数据。截至2014年12月,百度地图仅以导航为例,每天数十亿次用户的定位请求和响应转换成位置信息,实现了智能导航基础上的生活服务本地化。作为最具优势的主流生活服务平台,百度地图已容纳60余家数据合作伙伴,提供500多万生活服务类数据,日均定位请求超过35亿次。在此背后,除了预订酒店、电影票、餐馆之外,还包括附近的团购、优惠、外卖等,用户都能通过手机完成。

像百度地图这样借大数据为用户提供便利的软件还有很多,这些都是大数据时代给个人带来的便利。人们将各种新的信息发布到各个大数据平台上,而更多的人在分享着这些数据带来的便利。大数据时代,每个人都在创造着数据,每个人都在享受着大数据创造出的便利。

大数据帮了******

大数据看似枯燥无味,但很多时候,它会成为赢得一场“战争”最有力的武器。

2012年,美国总统******仰仗其大数据分析团队,击败竞争对手成功连任。好奇的人们想知道,到底大数据在选战里起到了怎样的作用?

在这次总统大选前,******能不能赢得连任充满变数。

从政绩上来看,******并没有做到之前承诺的将美国全国的失业率控制在7.4%以下;从选战的过程来看,竞争对手罗姆尼比******口才好,演讲水平也相当高超,公开辩论中,两个人不分上下;从对民众要求变革的呼应来看,临选前的民意调查,多数被调查者认为罗姆尼关于未来的见解更令人欣赏;从历来决定胜负的竞选资金投入来看,对手所花的费用比******多1亿美元。

这一切都说明,******要继续留在白宫似乎非常困难。但出人意料的是,******还是赢了罗姆尼。

后来人们普遍认为,让******赢得选举不是靠运气,而是仰仗他的竞选团队成效卓著的数据分析能力。******团队的竞选总指挥吉姆·梅西纳表示,在整个竞选过程中,******的每次活动都是以数据作为支撑,而对多种来源的数据进行搜集、整理、分析和运用,确保了以数据为基础的决策。

收集大量数据的工作是******团队在连任竞选两年前进行的,他们将民主党零散的选民数据汇总在一起。在考量了重要性和费用支出的前提下,******团队的数据专家们针对目标选民和拟开展的活动开发了不同的预测和分析模型。如对每一个群体的选民都进行建模,进而预测他们的政治意向。所建立的模型可以根据实际情况进行动态调整,这样提高了分析的精准性。当时,数据分析专家在俄亥俄州获得了约2.9万人的投票倾向数据,这是一个巨大的样本,占选民的1%。这个数据样本可以准确了解每一类人群和每一个地区选民在任何时刻的态度。******团队的一名成员表示,他们可以通过复杂的数学建模来找到目标选民。当第一次电视辩论结束后,选民的投票倾向会发生改变,团队通过相关数据分析就可以立即知道什么样的选民改变了态度,什么样的选民仍坚持原来的投票选择。在竞选过程中,他们筛选出目标选民并和他们接触,定向地说服他们,无疑这样的筛选就离不开数据的支持。

在连任竞选中,******团队充分信任数据分析,恰到好处地利用各种场合来争取选民。在每一次动员活动和公开辩论前,******团队都能根据受众的特点选取其最关心的议题,精心准备、博得支持。动员渠道和互动方式的选择也为目标选民量身定做。

同类推荐
  • 招商局与中国金融业

    招商局与中国金融业

    招商局的历史,就是中国近现代民族金融业的历史。140年前,诞生于“洋务运动”中的轮船招商局在内外阻力中翻开了中国金融业新的一页。今天,沿承百年血脉的招商局集团已经成为中国历史最悠久的民族企业之一。在近一个半世纪里,招商局一直扮演着中国金融业引路者的角色。从唐廷枢自设保险招商局,盛宣怀创办中国近代第一家银行,到袁庚打响“中国改革开放的第一炮”,再到平安保险拉开中国保险业海外引资的序幕……招商局不断用“第一次”引领着中国金融业的发展。《招商局与中国金融业》通过记录招商局自清末至今的发展历程,为读者提供了一个观察中国金融业发展的独特视角。《招商局与中国金融业》由王玉德、郑清、付玉著。
  • 顾客导向的内部营销

    顾客导向的内部营销

    本书通过对企业内部营销、员工工作满意及其顾客导向关系的研究,帮助企业充分理解内部营销哲学,确立内部营销观念,借助内部营销行为营造服务竞争优势。
  • 应该读点经济学

    应该读点经济学

    即使你从来没有接触过经济学,你也大可以放心,只要你有一颗好奇心就能够读懂本书,因为这本书正是用最简单的语言来讲述经济学的故事。为什么商家不仅向穷人发打折券,还向富人发涨价券?为什么荷兰有一种拍卖是从高往低报价,而且这样看似更为有效?奥林匹克公园边的居民凭什么不交“景观税”?罗纳尔多是曼联的员工还是奴隶?如果你也对这样的问题感兴趣的话,不妨看看这本书。作者通过大量阅读和深入思考,把自身领悟的极其重要又晦涩难懂的经济学概念掰开揉碎,并用一个个有趣的故事编织起来,没有公式和图表。读完你就能够理解每个面包从烤箱出来的原因,每笔商品交易背后的真相;走进超市,你会发现各种促销手段其实都是商家诱使你多花钱的花招;拿起报纸,你会发现经济新闻原来比娱乐新闻更加有趣;无论是投资股票、基金还是不动产,你都会更加游刃有余。
  • 金色的诞辰——武威区域经济实证分析

    金色的诞辰——武威区域经济实证分析

    本书内容有文化是明天的经济、民勤湖区的贫困问题怎样解决、走符合武威实际的可持续发展之路、如何启动运用好民间资金、着力把草畜产业培育成支柱产业等。
  • 评级真相

    评级真相

    2011年8月5日标准普尔将美国长期主权信用评级由“AAA”降至“AA+”,评级展望负面,引起世界一片哗然,而后是日本、欧洲各国,下调信用级别的新闻接连不断,金融人士惶惶不安。那么,为何信用评级机构在全球有这么大的影响力、它们采用的评级方法和机制是否合理?信用评级的背后是否隐藏着国家和利益集团的巨大阴谋?若评级失公,谁来保护我们的信用?中国的企业为何在海外发债成本比其他发达国家的企业发债成本要高很多?《评级真相》都将一一回答这些问题。
热门推荐
  • 龙珠重生

    龙珠重生

    魂穿天津饭,梦入龙珠世界。人人都说赛亚人血统是宇宙最强战斗种族。但是身具神秘三目族血脉的天津饭却表示不服,在不断的成长中慢慢发现三目族的各种奇特,直到踏出新手村地球,才发现,原来三目族才是宇宙最强的战斗种族!!!(我小时候只看了漫画,动画和剧场基本都没怎么看过,所以人物和故事都是在漫画基础上改编演绎的。写书只是为了兴趣,您的每一个评论、推荐、收藏、建议、鼓励,都将是我不断写作的动力。在此先谢谢一直支持我写到今天的各位读者!)
  • 娱记修仙

    娱记修仙

    是的,你没看错。娱记,就是你知道的娱乐记者(俗称狗仔),想知道一个狗仔怎么在仙侠世界放飞自我么?“啥?没系统?”“啥?没金手指?”“啥?没有老爷爷?”那穿个屁的越啊!!!
  • 天剑玄空

    天剑玄空

    超级码农林少羽在开发游戏中得了癌症,选择轻生后,却意外重生到一个以武为尊的玄幻世界,没想到自己设计的天宝手环和外挂系统也跟着一起穿越过来了,本想和谐生活,却天灾人祸,屡次被刺被利用,带着愤怒,他决定变强,却意外的唤醒了道尊元神,同时还知道了一个天大的秘密,人魔、邪修、妖乱、柔情、兽族、魔窟,天劫,艰难的道路上。他要仗剑玄穹,兽血沸腾,述说一个传奇,只为了情敌当年藐视自己,只为那些混蛋伤害自己。更是为了能打回去,老子是男人,干。
  • 2005年中国歌词精选

    2005年中国歌词精选

    编辑出版这个选本,一是为了展示这一年度歌词创作的佳作,为我国的文化积累作一点有益的工作;二是为尚示找到音乐伴侣的歌词牵线搭桥,希望能得到作曲家慧眼的赏识,为其插上音乐翅膀;三是为音乐文学爱好者和广大读者提供一个花最少的钱、用最短的时间享受中国歌词最新最佳创作成果的机会。这便是我们的初衷和愿望。编完一年一度的这个选本,有喜也有忧。喜的是这样一年又有许多词作者经过他们的辛勤耕耘,结出了丰硕的果实,写出了不少佳作,而且这一年又发现了一批名不见经传的新人,他们的作品虽然还有些稚嫩,但却能让人眼睛发亮。新人辈出的词坛一道令人鼓舞的景观,所以每年都有一批新人的作品。
  • 天行

    天行

    号称“北辰骑神”的天才玩家以自创的“牧马冲锋流”战术击败了国服第一弓手北冥雪,被誉为天纵战榜第一骑士的他,却受到小人排挤,最终离开了效力已久的银狐俱乐部。是沉沦,还是再次崛起?恰逢其时,月恒集团第四款游戏“天行”正式上线,虚拟世界再起风云!
  • 重生之带娃修仙

    重生之带娃修仙

    天才修士林羽,于渡劫飞升时在雷劫中形神俱灭,一缕残魂穿越到平行世界的另一个自己,来到一个没有灵气的世界。林羽脸上一副淡然:“没有灵气我就自己创造,这又如何难得倒我。”背着书包的林小萌冲入画面:“爸爸,我饿了,饭做好了吗?”
  • 枪神纪之末日余生

    枪神纪之末日余生

    一向痴迷于枪神纪的剧情,但就是看不到,小说基本都是同人的,官方也不发放,因此打算自己以官网中透露的一点一滴资料来凑出一套剧情...
  • 重组

    重组

    这是中国首部直面婚姻状况对家庭资产深刻影响的小说。重组不仅仅是一个经济概念,它还同样适用于婚姻。男主人公宋杨第一个女人和他一起创业十多年,生活稳定后,他带走财产的三分之一,离开了妻子和儿子;第二个女人有心陪他把生意做起来,但因为和公婆关系难处,被迫离开;第三个女人比他小20岁,闪电般的结婚又离婚后,他的资产再次严重缩水;第四个女人说服他把剩下的钱投入股市……一对在婚姻重组中失败的怨偶会如何面对资产重组?本书首次从“重组”的角度,直面婚姻状况对家庭资产的深刻影响。引导读者正视婚姻状态对生存状态的多方面深刻影响。
  • 倾生厌

    倾生厌

    叶深婉无数次的问向莫斯渺要怎么才肯放过自己?但是得到的回答永远“等我腻了。”叶深婉幻想过无数次亲手杀死莫斯渺的瞬间,也幻想过莫斯渺腻了自己的时候,但是她总不能耗尽一生,只为等他说一句可能。“你口口声声的说爱我,但一切都晚了!”叶深婉回想着自己说过的这句话,就像自己的名字一样,深婉,声晚。叶深婉一生都在追求极致的艺术,到了最后一刻她才知道“极致的艺术就是死亡。”那一天叶深婉问起自己,“你说,那些自杀的人,是想开了,还是没想开?”“没有人性的怪兽隐藏在人群中,恰巧我发现了你。”叶深婉拿着锐利地匕首,似笑非笑地对莫斯渺说起话。最后的最后,她信了莫斯渺口中的爱,她也找到了自己所要艺术。那血色的花开了,是曼珠沙华。
  • 高冷王爷对我束手无策

    高冷王爷对我束手无策

    不是说一个女人一辈子最好谈三次恋爱吗?一次懵懂,一次深刻,一次一生...萧瑜儿上辈子却是将三次都留了与之相伴一生的可能...原本萧瑜儿最理想的婚嫁年龄是二十七岁,而且在十八岁之前有再心仪的男子都不与之来往的,若真有了心仪的男子也是要等到十八岁才能与之往来,来往到二十七岁成婚,正好九年,可以取长长久久的寓意,若是不能继续,便在二十岁再与人来往,也是到二十七岁正好七年,若是七年不痒那便成婚,再再不济,我就到二十四岁再找一个心仪的男子来往个三年,若能经得住三年的考验那便成婚,若是都不成,那便不嫁!可是萧瑜儿穿越了,在还不满十五岁一个不留意,就会被野男人骗走了的年纪遇到了厉清夜...后来萧瑜儿才明白三年之约是厉清夜,七年不痒是厉清夜,长长久久也是厉清夜。