首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 图书频道 > 经济管理 > 经济 >

爆发:大数据时代预见未来的新思维(颠覆《黑天鹅》的惊世之作)(2)

2012-10-17 
  《爆发:大数据时代预见未来的新思维》是一本颠覆《黑天鹅》的惊世之作。如果说塔勒布认为人类行为是随机的,都是小概率事件,是不可以预测的那么全球复杂网络权威巴拉巴西则认为,人类行为93%是可以预测的,在大数据时代我们可以预测未来。
商家名称 信用等级 购买信息 订购本书
爆发:大数据时代预见未来的新思维(颠覆《黑天鹅》的惊世之作) 去商家看看
爆发:大数据时代预见未来的新思维(颠覆《黑天鹅》的惊世之作) 去商家看看

1919年,统一引力和电磁力仍然一个难以攻克的难题。基于此,卡鲁扎提出了一个出人意料的解决方法。他指出,假设世界不是三维而是五维的话,这两种力就能结合。这一假设自然会让人们不知所措,因为没有人能想象出那个神秘的五维世界是什么样。但卡鲁扎是那种看书学会游泳的人,所以他一直对理论知识怀有坚定的信念。这次也不例外,虽然这种想法有点违反直觉。
卡鲁扎写信给那位科学巨人并不只是出于礼貌——他想请爱因斯坦帮他发表他的论文。当时,像爱因斯坦这样的著名科学家都被誉为优秀科学杂志的守门人。如果爱因斯坦对某篇论文感兴趣,他就会在柏林科学院(Berlin Acadamy)的会议上加以推荐,之后论文就会发表在院报上。令卡鲁扎高兴的是,爱因斯坦愿意帮他。
一周后,也就是4月28日那天,爱因斯坦又给卡鲁扎写了一封信。信的开头相当鼓舞人心:“我读了你的信,而且发现它很有趣。我觉得实现这个理论没有什么不可能。”
不过,下面的内容就相对含蓄了:“但我必须承认里面的观点现在提出来还不具备什么说服力。”
对论文提出一些技术性问题和建议后,爱因斯坦接着说道:“如果你能精确地运用经验知识做出验证,我保证你的理论将是正确的。“
爱因斯坦答应卡鲁扎帮他打开学院大门,但有个条件:“如果上述有关测地线的问题解决的话,我会在学院面前呈交论文的简缩版。请不要责备我,因为在提交论文时,我会署上我自己的名字。”
想象一下几个星期来一连收到两封来自当时最具影响力的物理学家的信时,卡鲁扎会是什么样的心情吧。每封信都那么鼓舞人心,而且爱因斯坦一连写两封信更证明他是真的被这位没什么名气的物理学家的想法迷住了。但这些信也揭开了很多问题,以至于这篇论文多年都未成功发表。
先有爆发式,还是先有电子邮件
2005年,在纪念爱因斯坦奇迹年百年诞辰之际,我应以色列科学院(Israeli Academy of Science)之邀去耶路撒冷(Jerusalem)做演讲。会议日益逼近,但我的心思却没放在那上面。最近,优先级模型又出现了一些耐人寻味的新问题。你应该还记得,我们发现电子邮件通信具有间歇爆发性特征,也就是说在沉寂一段时间后人们总会疯狂地发送邮件。基于此,我开始考虑爆发模式到底是电子时代的副产品,还是显示出了人类活动的更深层次的真理?我们之前所做的所有研究——从电子邮件到网络浏览器——都或多或少跟电脑有联系。所以我们不禁要问一个逻辑性问题:爆发性和电子邮件到底谁先出现的?
我很快意识到,一些著名学者的信件都被后人完好地保存着,所以我想也许能从中找到答案。在网上搜索一番后,我将目标锁定在了艾伯特?爱因斯坦档案室(Albert Einstein Archives)上。这是耶路撒冷希伯来大学(Hebrew University of Jerusalem)的一个项目,他们的任务就是搜集所有爱因斯坦的信件并编纂入目。由于他们迟迟未给我回信,我干脆将他们的地址塞进背包,进行第二项计划:先庆贺爱因斯坦的奇迹年,然后去找爱因斯坦档案室的“老家”犹太国家图书馆(Jewish National Library)。
得来全不费工夫,几天后我受邀去参加一个耶路撒冷的招待会。我在那里结识了一些与会的著名科学史家。当我提到想研究爱因斯坦的信件时,他们指了指那个正好站在我背后的人。很快,我就被引荐给了戴安娜?科莫斯?布赫瓦尔德(Diana Kormos-Buchwald)——加州理工学院的历史系教授,爱因斯坦文件计划的负责人。她确信我找的那些资料虽然不完整,但确实存在而且已经被编纂入目。回国后,她把我介绍给了一同负责爱因斯坦文件计划的加州理工学院高级研究助理提尔曼?绍尔(Tilman Sauer)。联系了两周后,我就收到了艾伯特?爱因斯坦的全部信件,其中包括他跟西奥多?卡鲁扎的通信。
世界是多维的?
卡鲁扎在1919年5月1号给爱因斯坦的回信中打消了他的顾虑,促使爱因斯坦又在5月5号给他回了信:
亲爱的同仁:
我很乐意将你论文的部分摘录提交给学院的会刊。同时,我建议你将寄给我的手稿发表在杂志上,比如《数学杂志》(Mathematische Zeitschrift)或者《物理年鉴》(Annalen der Physi)。只要你愿意,我随时乐意以你的名义将论文提交上去,而且会配以我的简单介绍。
是什么让爱因斯坦这么快就改变了主意呢?我们可以从信中发现一些迹象:“我现在相信,根据实验证明,你的理论已经无懈可击了。”
这个结果对卡鲁扎来说再好不过了。爱因斯坦这位以无止境地追求用实践攻克所有数学问题而闻名的伟人接受了他的观点,承认了我们的世界是五维的。你和我可能都不怎么明白什么是五维世界,但意识受限绝不会阻止一位对数学理论极具洞察力的物理学家的脚步,他会坚持不懈地揭开宇宙的奥秘。如果数学证明世界是更多维的,谁又能够阻挡呢?
爱因斯坦多久回信
爱因斯坦的通信异常频繁——他一生共寄出了大约14500封信,收到了16000多封。这意味着,他成年后平均每天(算上周末)不止写一封信。虽然很惊人,但我感兴趣的不是他的通信数量。我关心的是优先级模型,我想弄清爱因斯坦会等多久才会回信。
我的研究小组里有一位聪明的葡萄牙籍物理系学生若昂?伽马?奥利维拉(Jo?o Gama Oliveira),是他最先对加州理工学院提供的数据做了研究。他的分析表明,爱因斯坦的回信模式跟我们的电子邮件模式差不多:他会立即在一两天内回复大量信件。然而,有些信要在他的桌子上呆几个月甚至是几年才会得到答复。令我们没想到的是,若昂的观察表明爱因斯坦的回信时间跟我们之前检测到的电子邮件回复时间一样都遵循幂律分布。
若昂和我首先担心的是爱因斯坦回信模式中的长期间隔是由于资料库中信件不全造成的。然而,加州理工学院的提尔曼?绍尔向我们保证,那些长期间隔绝对是因为时间耽搁了。比方说,爱因斯坦在1921年10月14日给克朗尼格(Ralph de Laer Kronig)的回信中这样写道:“我在累积成山的信件中发现了您去年9月份那封有趣的来信。”的确,记录表明克朗尼格的信被埋在爱因斯坦的桌子上一年多都没得到回复。
但是,不止是爱因斯坦的通信遵循这样的模式。通过英国剑桥大学达尔文通信项目(Darwin Correspondence Project),我们获得了查尔斯?达尔文的所有信件记录。由于认真的达尔文将所有寄出以及收到的信件都备了份,他的通信记录就相当准确了。我们的分析发现,他也是马上回复大量信件,只有极少数会耽搁不回。总的来说,达尔文的回信时间跟爱因斯坦的一样都严格遵循幂律规律。
两位不同时代(爱因斯坦在达尔文去世前3年出生)、不同国籍的学者的通信记录都遵循一样的规律这一事实,不是表明我们在窥视某人的特殊癖好,而是发现了前电子时代人们通信的基本模式。这也意味着,不管我们的信息是在电脑上以光速传播,还是用蒸汽机船慢慢地漂洋过海,我们的通信模式都是一样的。事实上,不管是过去还是现在,时间对我们来说都异常珍贵。我们必须设定优先级,就算是伟大的爱因斯坦和达尔文也不例外。如此一来,拖延、爆发点和幂律分布就会不可避免地出现。
但电子邮件和纸质信件之间还是存在一个特别的差异:两者数据集中的幂——定性幂律的关键参数——不同。 这种差异意味着,在电子通信模式中长时间被耽搁的信件要比纸信通信中少。基于电子通信的即时性,这种差异也并不令人吃惊。
然而,事实上这种差异不是发信时间造成的。数十年来的研究结果表明,定性幂律的幂不是一个任意值,而是与通信模式背后的潜在原理紧密联系的。也就是说,如果一个能够描述两种现象的幂律的幂不同的话,那么支配这两种体系的原理就有本质的不同。所以这种差异表明,如果想说明爱因斯坦和达尔文的通信模式,我们就必须建立一个新模型。
将卡鲁扎打回原点
受到爱因斯坦的鼓励后,西奥多?卡鲁扎很快按照要求做了改动,寄去了一份适合在院刊上发表的简缩版论文。他的事情已经很明朗了——不到四个星期他就收到了四封回信,这表示那位著名的物理学家已经破格将他的事放在了优先位置上。但爱因斯坦在1919年5月14日那天的回信中又显得颇为冷淡。“我最最亲爱的同仁,”他写道:“我已经收到了你为学院准备的论文。不过,在对你的问题进行仔细考虑后,我发现了另外一个难题,而且直到现在我都无法解答。”
利用四点论推导法,爱因斯坦详细说出了自己的困惑,并在最后总结道:“或许你能找到一个解决方法。无论如何,我会等到这些问题解决后才递交你的论文。”
就这样,爱因斯坦将卡鲁扎打回了原点。
到达率与回复率
在优先级模型中,我们假设一旦首要任务完成,任意一项新的优先任务就会将之代替。要想得出爱因斯坦通信的精确模式,我们需要将这个模式作一番修改,加上一些纸信通信的特点。的确,在蜗牛邮件模式下,邮递员每天都会送来一定数量的邮件,然后这些信就加入到了等待回复信件的大军中去。只要时间允许,爱因斯坦会从一大堆信件中选择他认为最重要的加以回复,然后将剩下的留待下一天处理。所以爱因斯坦的通信模式包含着两个因素:
1)我们将其中一种概率称为到达率,也就是到达爱因斯坦桌子上,开始排长队的信件。他会从其中选出一些优先信件。
2)另外一种概率我们称为回复率。他会选择优先级最高的信件加以回复。
如果爱因斯坦的回复率大于信件的到达率,那么他的桌子总体上看会干净很多,因为他在收到信后会立即回复一大部分。在这种亚临界状态下,通信模型显示爱因斯坦的回信时间符合指数分布,其中没有长时间耽搁的情况。很明显,这与我们观察到的幂律分布不同。
不过,如果爱因斯坦的回复率小于信件的到达率,那么日复一日他桌上的信件就会越堆越高。有意思的是,只有在这种超临界状态下,回信时间才符合我们之前观测到的爱因斯坦和达尔文通信模式所显示出的幂律分布。所以,爆发性的出现表明爱因斯坦已经无暇分身,以至于被忽略的信件越积越多。 但他真的那么忙吗?
虽然在奇迹之年只有7封信件留存,但我们完全可以说在1905年这位尚不知名的专利承办员肯定有时间将通信放在首位。的确,那个时候关注他的只有他的家人和朋友。十年后,也就是1905年时,他已经成为知名物理学家了。这时他有责在身,不得不隔几天就写封信。虽然那个时期只有12封信留存,但这既不能表明他特别重视通信,也不能看出其中有特别的延误。
但如果爱因斯坦能够勤于通信——正如他在1919年及时回信给卡鲁扎那样——那么他的回信时间就会符合指数分布而不是我们观测到的幂律分布。也就是说,如此一来他的通信模式中就不会有延误和爆发点出现。

相关阅读:

蜀红(林苡安著)

独领风骚(套装上下册)(张廉著)

青春白恼会1:恋爱零突破 (阿敏著)

嬉笑姻缘乱君心(风姿卓绝的番茄哥)

做最好的中层(成杰著)

权谋:如何赢得权力(克里斯.马修斯)

正能量:职业经理人的养成(林正刚著) 

更多图书资讯可访问读书人图书频道:http://www.reAder8.cn/book/

热点排行