大数定律

  • 201
  • A+



大数定律又称“大数法则”或“平均法则”。在随机事件的大量重复出现中,往往呈现几乎必然的规律,这类规律就是大数定律。在试验不变的条件下,重复试验多次,随机事件的概率近似于它的概率。


大数定律的案例一位数学家调查发现,欧洲各地男婴与女婴的出生比例是22:21,只有巴黎是25:24,这极小的差别使他决心去查个究竟。最后发现,当时的巴黎的风尚是重女轻男,有些人会丢弃生下的男婴,经过一番修正后,依然是22:21。中国的历次人口普查的结果也是22:21。人口比例所体现的,就是大数定律。


大数定律反映了这世界的一个基本规律:在一个包含众多个体的大群体中,由于偶然性而产生的个体差异,着眼在一个个的个体上看,是杂乱无章、毫无规律、难于预测的。但由于大数定律的作用,整个群体却能呈现某种稳定的形态。


花瓶是由分子组成,每个分子都不规律地剧烈震动。你可曾见过一只放在桌子上的花瓶,突然自己跳起来?


电流是由电子运动形成的,每个电子的行为杂乱而不可预测,但整体看呈现一个稳定的电流强度。


一个封闭容器中的气体,它包含大量的分子,它们各自在每时每刻的位置、速度和方向,都以一种偶然的方式在变化着,但容器中的气体仍能保有一个稳定的压力和温度。


某个人乘飞机遇难,概率不可预料,对于他个人来说,飞机失事具有随机性。但是对每年100万人次所有乘机者而言,这里的100万人可以理解这100万次的重复试验,其中,总有10人死于飞行事故。那么根据大数定律,乘飞机出事故的概率大约为十万分之一。这就为保险公司收取保险费提供了理论依据。对个人来说,出险是不确定的,对保险公司来说,众多的保单出险的概率是确定的。根据大数定律的定律,承保危险的单位越多,损失概率的偏差越小,反之,承保危险的单位越少,损失概率的偏差越大。因此,保险公司运用大数定律就可以比较精确地预测危险,合理保险费率。


小刀锯大树:赌客久赌必输的另一个秘密,即大数定律。赌王何鸿燊刚刚接手葡京赌场的时候,业务蒸蒸日上。


赌王居安思危,请教“赌神”叶汉:“为什么这些赌客总是输,长此以往他们不来赌怎么办?”


叶汉笑道:“这世界每天都死人,你可见这世上少人?”


叶汉的回答甚妙,道出了一条无论是保险公司、赌场还是骗徒,都信仰的法则:大数定律。


赌场本质上是一种温和的“概率场”,概率法则非常明显。一直玩下去,大数定律的作用就会日益显现出来。


庄家在规则上占有少许优势,玩的次数越多,这种优势越能显现出来。

久赌神仙输,赌圣也不行。


一天,一位沙特王子入住葡京酒店。王子找到赌王,说:我就和你玩一把掷硬币。出正面我给你50亿美元,出反面你的赌场归我。


赌王呵呵一笑:这个游戏固然公平,但不符合我们博彩业的行事法则。我们开赌场不做一锤子买卖,而是小刀锯大树。如果你真的想玩,我们就玩掷骰子,1000下定输赢。你赢了,可以把我的产业拿走,我赢了,只收你20亿。


沙特王子无奈,只好退出赌局。


这个故事是虚构的,旨在说明大数定律之于赌场的意义。开赌场不做一锤子买卖,而是“小刀锯大树”。所以,赌场最欢迎的是斤斤计较、想碰一下运气的散客,他们虽然下注谨慎,却构成了庞大的行为基数。


这种客人会给赌场老板带来几乎线性的稳定收益,是赌场最稳定的收入来源,这是大数定律在起作用。


还有一种是一掷千金、豪气干云的大赌客,他们的下注额若在赌场的风险控制范围,也很难从赌场赢钱,会成为赌场的VIP客户。


假如有一个超级赌客,比如上面虚构故事中的沙特王子。他的赌注超过了普通赌客的千倍万倍,这会导致赌场收益的大幅震荡,极端情况下可能导致赌场破产。因此,全世界所有赌场都会设定最高的投注限额。赌场设最低及最高的投注限额,即便“新郎行运一条龙”的事故发生,也不至于让赌场亏太多。这样,赌场老板就可以安心睡觉了。

所有的VIP加起来,等于庄家和客人玩了一场长期游戏,大数定律依然有效。

大数定律

延伸阅读:雅各布与大数定律雅各布·贝努利(Jacob Bernoulli)1654年生于瑞士,他没有遵照父亲的意思去当律师或经商,而是自学成为了一名数学家。


雅各布和牛顿生活在同一时代,他有着贝努利家族传统的自负心态,他认为自己和牛顿不相上下。1703年,雅各布·贝努利率先提出了如何从样本中发现概率的问题。雅各布教授自己的弟弟约翰数学。约翰和雅各布一样聪明,而且和他的哥哥一样,他是个对名声的追求近乎病态的人。雅各布和弟弟约翰有一个习惯,就是对一个问题有竞争性地进行研究,并且在媒体中毫不留情地攻击对方。


雅各布虽然发现了大数定律,但由于兄弟俩在科学问题上过于激烈地争论,致使双方的家庭也被卷入。雅各布死后,他的《猜度术》手稿被他的遗孀和儿子在外藏匿多年,直到1713年才得以出版。


《猜度术》是雅各布·贝努利一生最有创造力的著作,在这部著作中,他提出了概率论中的“贝努利定理”,该定理是“大数定律”的最早形式。为了说明大数定律,雅各布假设了一个装满3000枚白色石子和2000枚黑色石子的罐子,但外人不知道每个颜色的石子的数目。我们从罐子中,按不断增加的数目取出石子,并在将它们放回瓶子之前,记录每枚石子的颜色。如果我们取出越来越多的石子,最终我们会得到“接受必然的可能性”,也就是说,在实际事件上是必然的,但又不是绝对的必然,两种颜色石子的比率是3:2。


雅各布的计算显示,从罐子中取出2555枚石子后,则有大于1000/1001的概率使其结果与真实结果(3:2)间的差异在2%之内。也就是所谓的“接受必然的可能性”。雅各布宣称,我们可以对任何不确定的数量进行科学的预测了。如果我们可以像“先知”一样,几乎能很准确地预言“事后”。


由于“大数定律”的极端重要性,1913年12月彼得堡科学院曾举行纪念大会,庆贺“大数定律”诞生200周年。


《猜度术》是概率论的第一部奠基性著作,所含概率思想具有划时代的重大意义,可谓对概率论做出了决定性的贡献,推进了概率论的进一步发展。因而其出版是概率论成为独立数学分支的标志。


“撞骗”的数理依据你是否收到过这类短信:请直接把钱打到工商银行卡号6220219 ***这叫“撞骗”,是一种传统骗术。版本甚多,比如寄中奖信、打中奖电话、发电子邮件。也就是骗子像没头苍蝇一样乱撞,“有枣没枣打一杆子”或许能“瞎猫捡个死老鼠”。是不是觉得骗子很蠢?但骗徒的行为却是合乎统计原理的,在数理上是被支持的。只要发出的短信足够多,其成功率非常稳定,合乎大数定律。


福建的某个小镇,众多乡亲都从事这个行当,短信群发器在这个偏远小镇非常普及。当警察抓获了这批刁民后,奇怪的是,过了很长时间了,居然还有人不断地往查获的卡上汇钱。有人曾做过统计,类似这种垃圾短信,每发出一万条,上当的人有七到八个,成功率非常稳定。人过一百,形形色色。一万个人里面,总会有几个“人精”,几个笨蛋,这是可以确定的。究其根源,都是由于大数定律的作用。


在社会、经济领域中,群体中个体的状况千差万别,变化不定。但一些反映群体的平均指针,在一定时期内能保持稳定或呈现规律性的变化。大数定律是保险公司、赌场、撞骗的骗徒,赖以存在的基础。


无视样本大小30多年前的一个下午,在芝加哥的一间咖啡馆里,特韦斯基和约翰·杜伊教授在悠然地喝着咖啡。特韦斯基貌似无心地问:有两家医院,在较大的医院每天都有70个婴儿出生,较小的医院每天有20个婴儿出生。众所周知,生男生女的概率为50%。但是,每天的精确比例都在浮动,有时高于50%,有时低于50%。在一年的时间中,每个医院都记录了超过60%的新生儿是男孩的日子,你认为哪个医院有更多这样的日子?(正确答案是:小医院,看官你打对了么?)


我们知道,大数定律需要很大的样本数才能发挥作用,基数越大,就越稳定。随着样本的增大,随机变量对平均数的偏离是不断下降的。所以,大医院更稳定。这一基本的统计概念显然与人们的直觉是不符的。


杜伊先生果然钻进了圈套,他认为较大的医院有更多超过60%的新生儿是男孩的日子。一个整天向学生灌输大数定律的教授,自己居然不相信大数定律!普通人又如何呢?特韦斯基后来把这个问题做了严格的实验。22%的受试者认为较大的医院有更多这样的日子,而56%的受试者认为两个医院有相等的可能性,仅22%的受试者正确地认为较小的医院会有更多这样的日子。


德州扑克
德州扑克