您还没有绑定微信,更多功能请点击绑定

优思学院:Weibull 分布 和 Lognormal 分布(二)

原刊于 优思学院 知乎 帐号
 
 在上一篇文章《Weibull 分布 和 Lognormal 分布(一)》,我们谈到除了正态分布外,另外两个偏态的分布,分别是Weibull 分布 和 Lognormal 分布,我们直方图和拟合曲线的相似度,跟据视觉观察,估计数据适合何种分布。

不过,这当然不是最有效和准确的方法,而且在上一篇文章的银行索赔处理时间的例子中,Weibull 分布 和 Lognormal 分布都看似合适,问题是哪一个才是真正合适呢?这里,我们就需要借助软件Minitab中的Probability Plot功能了。

我们试举一个例子。以下图中所见是银行客服电话的处理时间(Throughput Time - THT)的直方图。图中所见,我们可以从视觉判断中知道,这分布一定不是正态分布。但究竟是用Weibull 分布 和 Lognormal 分布哪一个较好呢?优思学院・六西格玛培训课程


我们可以把数据输入到Minitab中的C1栏位(THT (sec)),然后,使用Probability Plot的功能,见下图。优思学院・六西格玛培训课程


接着,我们应该选择Single Variable,即是单个变量,如下图,之后点选OK。优思学院・六西格玛培训课程


把 C1 设定为分析对象,然后,点选 Distribution(分布),因为这个功能预设为正态分布,而今次我们希望先测试的是Lognormal分布和Weibull分布。[优思学院・六西格玛培训课程]


选择Lognormal之后,按两次OK。


最后,我们就会得出Lognormal的Probability Plot。


当然,用同样的方法,我们也可以得出Weibull 分布的Probability Plot。



结果分析

第一,我们会先观察数据是否都在红色线的范围之间,如果是的话,表示数据对该分布拟合度较高。从Weibull分布和Lognormal分布的两个Probaility Plot中所见,明显地Weibull分布拟合度较低。

第二,我们可以比较它们的AD值。AD值是Anderson Darling Value,用于量度数据服从特定分布的程度,AD值代表了数据点和理论值的距离,因此这个值越低,拟合度越高。

总的来说,从以上两点观察所见,银行客服电话的处理时间的分布,较服从于Lognormal分布。

以前,大部分的六西格玛绿带[2]和黑带[3],都是针对制造生产工程的改善项目,大部分时间会处理正态分布,或是泊松分布和二项分布[4],很少接触偏态分布。优思学院[5]也观察到关于Lognormal或者Weibull分布的资料在网上不多,又或者写得太复杂、太深奥,令人难以理解,所以,希望透过这篇文章,介绍一下。

事实上,在中国的服务业的质量水平仍有待提升,且服务性质的企业运用六西格玛的还是不多,我们应该从这方面尽力推动六西格玛在服务业上的发展,提升服务业的质量水平。
 
 
 
 

2 个评论

游客无法查看评论和回复, 请先登录注册