您还没有绑定微信,更多功能请点击绑定

拟合优度检验的运用,拟合对比图已经添加

本帖最后由 jason84.wu 于 2011-1-3 19:03 编辑

在6sigma的诸多工具中,部分工具不为人们熟悉,这里就拟合优度检验的运用举一个例子。

1、名词解释:
a 拟合优度检验,是检验来自总体中的一类数据其分布是否与某种理论分布相一致的统计方法.适用于检验观测到的数据分布,是否和某个人们预期的分布没有显著不同。
b 本福特定律,也称为本福德法则,说明一堆从实际生活得出的数据中,以1为首位数字的数的出现机率约为总数的三成,接近期望值1/9的3倍。推广来说, 本福特定律越大的数,以它为首几位的数出现的机率就越低。它可用于检查各种数据是否有造假。在各种审计中很有用。
本福特定律的分布如下:
d p
1 30.1%
2 17.6%
3 12.5%
4 9.7%
5 7.9%
6 6.7%
7 5.8%
8 5.1%
9 4.6%
d,数字的类型;p数字出现的概率。可以看到:以1为首位数字的数的出现机率约为总数的三成,接近期望值1/9的3倍。

2、数据收集
选择6SQ网站\六西格玛板块中每个帖子的查看数的首位,例如,第一个帖子有1234个人查看过,那就是1。累计1-9各个数字出现的次数。共统计296个帖子。数据如下:

number 1 2 3 4 5 6 7 8 9
observed 107 47 39 23 25 16 13 13 13
real percentage 36.15% 15.88% 13.18% 7.77% 8.45% 5.41% 4.39% 4.39% 4.39%
expected percentage 30.10% 17.60% 12.50% 9.70% 7.90% 6.70% 5.80% 5.10% 4.60%


3、拟合优度检验,
选择帖子查看数的首位,即1-9各个数字出现的次数作为观测值,本福特定律的分布作为期望分布。拟合优度检验如下:
Chi-Square Goodness-of-Fit Test for Observed Counts in Variable: C1

Test Contribution
Category Observed Proportion Expected to Chi-Sq
1 107 0.301 89.096 3.59784
2 47 0.176 52.096 0.49849
3 39 0.125 37.000 0.10811
4 23 0.097 28.712 1.13635
5 25 0.079 23.384 0.11168
6 16 0.067 19.832 0.74043
7 13 0.058 17.168 1.01190
8 13 0.051 15.096 0.29102
9 13 0.046 13.616 0.02787


N DF Chi-Sq P-Value
296 8 7.52368 0.481


P-value = 0.418 > 0.05, 说明龙天网站的热门程度没有作假.
对“好”的回答一定要点个"赞",回答者需要你的鼓励!
已邀请:

reiden (威望:3) (江苏 无锡) 电气或能源 主管

赞同来自:

楼主很强大,学以致用啊

5 个回复,游客无法查看回复,更多功能请登录注册

发起人

jason84.wu
jason84.wu

梦想,有胜于无

扫一扫微信订阅<6SQ每周精选>