您还没有绑定微信,更多功能请点击绑定

有趣的泊松分布研究


多年以前,有报道说某家民航航空公司的飞机发生空难后,出事后的第二天很多人都害怕乘坐这家航空公司的飞机。与朋友讨论时,运用统计学中简单的概率知识来做解释,得出前一天发生空难后,第二天乘坐飞机反而是相当安全的结论。虽然结论是对的,但我的推理并没有说服朋友。我在讨论时做了一个简单的假设,即发生空难的概率是0.01%=100ppm,因为每次发生空难的事件是独立事件,所以连续两天发生两次空难的概率为0.01%×0.01%=0.000001%=0.01ppm,从概率的角度来看,安全性提高了10000倍。但朋友不认可这种解释,他说这0.01ppm的概率为两架飞机同时失事的概率,那还可以让人接受,确实是一个非常小概率的事件。但如果按我的推理,两天内发生两次空难和一年内发生两次空难的概率好像都是一样啦?!

这确实是个问题,我的解释真的经不起反问。一直思索这个看似简单的问题如何才能做出一个满意的解释!

后来因要参加国家注册质量工程师的考试,又系统地复习了概率论方面的知识。泊松分布是要求质量工程师必须掌握的一个非常重要的概率分布。在仔细研究泊松分布的概念时,灵感来啦!原来,我冥思苦想的飞机空难事件事实上是一个典型的服从泊松分布的随机事件。

当初,在做空难发生率的假设时忽略了一个单位时间的要素,正确的假设应该表达为诸如“每天空难的发生率平均为0.1次(等价于平均每10天发生1次)”的形式。也就是说每两天空难的发生率平均为0.2次。空难事件的泊松分布表达式如下:

这里λ=0.2,i是连续两天内发生空难的次数,P(X=i)则表示连续两天发生i次空难的概率。
因此P(X=0)=81.873%,P(X=1)=16.374%,P(X>=2)=1.752%,也就是说两天之中至少发生一次空难的概率为(16.374%+1.752%)=18.127%,而已发生一次空难后,两天内仍会发生空难的概率应为发生两次或两次以上空难的所有机会的概率和,也就是1.752%。基于泊松分布的这种推理证实安全性确实提高了18.127%/1.752%=10.3446倍。显然这样的推理更容易让人接受,安全性并没有达到前面所推理的10000倍,仅提高10倍而已。
那么,前一种推理的问题出在哪儿呢?前一种推理中“飞机空难”的概率为0.01%这个假设是对“飞机空难”这个随机事件的基本描述。基于这种描述时,“飞机空难”这个随机事件实际上是典型的服从二项分布的事件。这时空难事件的二项式分布表达式如下:

这里p=0.01%是发生空难的概率,i是发生空难的次数,n则是应该假定的飞机飞行的航班次数。显然,在这里计算空难发生多少次的概率离不开飞机航班总次数这个限定参数,因为次数越多,发生空难的概率肯定就越大。如果要计算两天内分别发生i次的概率,则要获取两天总飞行的航班次数n这个参数。现在我们假定两天内飞行航班总次数为2000次,那么按上述公式计算,则P(X=0)=81.872%,P(X=1)=16.376%,P(X>=2)=1.752%,也就是说两天之中至少发生一次空难的概率为(16.376%+1.752%)=18.128%,,而已发生一次空难后,两天内仍会发生空难的概率应为发生两次或两次以上空难的所有机会的概率和,也就是1.752%。基于二项式分布的这种推理证实安全性确实提高了18.128%/1.752%=10.3489倍。

我们可以看到,按泊松分布计算的空难概率与按二项式分布计算的空难概率几乎是一样的,这里的二项式分布的假设实际上等同于每天空难的平均发生率也为0.1次。也就是说,假设的条件是一样的,其计算出的结果也是一致的。其实泊松分布是从二项式分布中推导出来的,其本质是一样的。泊松分布是n很大、p很小时的二项式分布的另一种表达方式。

现在如果我们按二项式分布来做新的假设,空难发生率仍为p=0.01%,但总航班次数增加了10倍,达到了20000次时,这时我们计算出的P(X=0)=13.532%,P(X=1)=27.067%,P(X>=2)=59.401%。这时,至少发生一次空难的概率为(27.067%+59.401%)=86.468%,至少发生两次空难的概率为59.401%,发生一次空难后安全性只提高(86.468%/59.401)=1.4557倍。这时若作换算的话,实际上相当于空难发生率平均每天1次,也就是说,如果每天平均空难发生率越高,发生一次空难后的安全性提高越少。

因此,在讨论单位时间内发生一次空难后乘坐飞机的安全性提高了多少倍的问题时,必须基于单位时间内空难发生的平均次数(在空难平均发生概率以及单位时间内总航班的次数已知时也可算出单位时间内空难发生的平均次数)这个参数,否则将缺乏讨论的基本依据。

有趣吧!

泊松分布是在做物料计划、生产计划和资源配置等方面的规划时经常会用到的一种非常重要的分布,在精益生产中进行生产线平衡规划时也要用到,甚至在SPC的不合格数控制图(C图)和单位产品不合格数控制图(u图)中也是基于不合格数服从泊松分布这个假设来设定控制限的。

关于泊松分布的应用,下次再做一个客服人员配置方面的研究,真是相当有趣。
在上一个关于泊松分布的研究案例中,我们基于泊松分布和二项式分布考察了飞机空难的安全性问题,实际上在公司经营的运筹方面,泊松分布发挥着重要作用。今天我们来考察有关资源配置的问题。

假设某公司的客服部门每天在工作时间内平均有1000个客服电话打进来,每个客服人员平均每2分钟可接听1个电话,按每天有效工作时间400分钟规划,要求99%的客户来电后在线等待不得超过1分钟。请问应配备多少客户人员?

这个案例中涉及两个泊松分布的事件。一个是1分钟内打进的客服电话个数;另一个则是1分钟内接听的客服电话个数。我们先来考察1分钟内打进的客服电话个数这个随机事件的概率分布。根据已知条件,平均每分钟打进的客服电话为1000/400=2.5次,即λ=2.5。这个随机事件的泊松分布表达式如下:



P(X=i)表示1分钟内打进i个客服电话的概率。因此P(X<=6)=P(X=0)+P(X=1)+ P(X=2)+P(X=3)+P(X=4)+P(X=5)+P(X=6)=98.58%,P(X<=7)=P(X<=6)+P(X=7)=99.57%,也就是说1分钟内打进的电话次数不超过6次的概率为98.58%,而不超过7次的概率为99.57%。也就是说,如果接听电话的能力为1分钟内至少可接听6个的话,则能保证1分钟之内打进的电话中98.58%的电话都能在不超过1分钟的等待时间内得到接听。按照规划,要求99%的客户来电后在线等待不得超过1分钟,那么接听电话的能力规划为1分钟之内至少可接听6个电话是不能保证1分钟打进的电话中99%的电话都能被接听。显然,接听电话的能力应规划为1分钟之内至少可接听7个电话,这样1分钟打进的电话中99.57%的电话都能被接听。

那么,现在我们来考察接听电话的个数这个随机事件的概率分布。根据已知条件,平均每人每2分钟可接听客服电话的个数为1个,则平均每分钟可接听的电话为0.5个,即λ=0.5。这个随机事件的泊松分布表达式如下:



P(X=i)表示一个客服人员1分钟内可接听i个客服电话的概率。因此P(X=0)=60.65%,P(X=1)=30.33%,P(X>=2)=9.02%,P(X>=3)=1.44%。就是说1分钟内客服人员不能接听新的来电的概率为60.65%,而能接听新的来电的概率则为1-60.65%=39.35%,能接听超过1个新的来电的概率为9.02%,而能接听超过2个新的来电的概率太小可以忽略不计。那么我们假定需要n个客服人员,则n个客服人员中1分钟内不能接听新的来电的人员数为:60.65%×n,能接听新的来电的人员数为39.35%×n,能接听超过1个新的来电的人员数为9.02%×n。那么保守地计算,1分钟之内至少可接7个电话的人数因满足:(39.35%+9.02%)×n>=7。即n>14.47,取n=15。因此实际规划中应配备的客服人员为15人。

配置15个客服人员时,平均每天可接听电话的总数为:15×400/2=3000,因此客服人员资源的利用效率为1000/3000=33.3%。如果要让客服人员资源的利用效率达到100%,则只需配备1000/200=5人,但5个人的配置1分钟之内只可接听2.4个新的来电,相当于只能满足大约65%的客户在线等待的时间不超过1分钟,另外35%的客户可能因为在线等待时间过长而产生不满。所以,公司在人员配备的策划时,应充分权衡人员资源的利用效率和客户满意这两个因素,作出最佳的配置。

0 个评论

游客无法查看评论和回复, 请先登录注册

发起人

推荐文章

文章状态

  • 发布时间: 2010-02-08 16:19
  • 浏览: 3729
  • 评论: 0
  • 赞: 0