MSA在服务业应用中遇到问题,求解答
当前公司在实际中遇到一个问题,考虑用MSA解决:公司帮助客户评价其产品并给出评价报告,报告质量很重要。所以需要审核部安排审核员进行审核,审核员根据公司审核标准找出报告中不合理的地方按标准对报告扣分,理论上对于同一份报告在不同时间、不同分公司、不同审核员的审核下扣分应该相同,但实际中是肯定有差别的,是否可以通过MSA进行分析,得到这样几个结论:审核员自身一致性如何(自己对标准理解是否一致)?审核员之间一致性如何?差异是否可接受?(假设20%的偏差是可以接受的)
设计如下:
在报告库中随机抽取10份报告,随机从12个审核员中抽取3人分别对10份报告检查3次看扣分数,得到数据如附件。
有若干问题求解答:
1. 是否需要为每份报告设立一个扣分的基准(最佳扣分值)?
2. 因为报告是随机抽取的,报告之间的差异可能会非常大,这个是否可以?还是说这10份报告一定要抽取水平相近(理论上扣分值相同)的?
3. 使用minitab进行分析的时候,应该选交叉还是嵌套?分析方法用方差分析吗?选项里的过程公差应该填写吗?因为不是实际产品,有所谓规格上下限吗?
数据: pan.baidu.com/s/1qZdcCEg
设计如下:
在报告库中随机抽取10份报告,随机从12个审核员中抽取3人分别对10份报告检查3次看扣分数,得到数据如附件。
有若干问题求解答:
1. 是否需要为每份报告设立一个扣分的基准(最佳扣分值)?
2. 因为报告是随机抽取的,报告之间的差异可能会非常大,这个是否可以?还是说这10份报告一定要抽取水平相近(理论上扣分值相同)的?
3. 使用minitab进行分析的时候,应该选交叉还是嵌套?分析方法用方差分析吗?选项里的过程公差应该填写吗?因为不是实际产品,有所谓规格上下限吗?
数据: pan.baidu.com/s/1qZdcCEg
没有找到相关结果
已邀请:
16:52更新:
单因子方差分析: C17 与 C16
方法
原假设 所有均值都相等
备择假设 至少有一个均值不同
显著性水平 α = 0.05
已针对此分析假定了相等方差。
因子信息
因子 水平数 值
C16 3 1, 2, 3
方差分析
来源 自由度 Adj SS Adj MS F 值 P 值
C16 2 148.67 74.333 14.23 0.005
误差 6 31.33 5.222
合计 8 180.00
模型汇总
R-sq(调
S R-sq 整) R-sq(预测)
2.28522 82.59% 76.79% 60.83%
均值
C16 N 均值 标准差 95% 置信区间
1 3 19.00 2.65 (15.77, 22.23)
2 3 11.333 1.528 (8.105, 14.562)
3 3 20.67 2.52 (17.44, 23.90)
合并标准差 = 2.28522
Tukey 配对比较
使用 Tukey 方法和 95% 置信度对信息进行分组
C16 N 均值 分组
3 3 20.67 A
1 3 19.00 A
2 3 11.333 B
不共享字母的均值之间具有显著差异。
我权限不够,看不到你的附件。
如果我没猜错,这是你要做的项目。目标是减小审核员对同样问题的判断差异....
对于已经存在的数据,我们用方差分析看看审核员之间打分有没有本质差异,因为报告是随机抽取的,审核员也是随机抽取的。具体打分过程我不知道您是怎么安排的,从数据是看,我们假设打分是独立进行的哈。
因为数据平衡,选用方差分析中的“平衡方差分析”,两个因子均为随机变量,模型中加入报告和审核员的交互作用:我分析的结果可能让您失望了:审核员打分没有本质区别!另外方差齐性检验没有发现异常:三个审核员打分的波动是一致的....
方差分析: 扣分值 与 审核员序列, 报告序列
因子 类型 水平数 值
审核员序列 随机 3 1, 2, 3
报告序列 随机 10 1, 2, 3, 4, 5, 6, 7, 8, 9, 10
扣分值 的方差分析
来源 自由度 SS MS F P
审核员序列 2 5.8 2.9 0.12 0.891
报告序列 9 34046.5 3782.9 152.82 0.000
审核员序列*报告序列 18 445.6 24.8 1.40 0.165
误差 60 1060.0 17.7
合计 89 35557.8
S = 4.20317 R-Sq = 97.02% R-Sq(调整) = 95.58%
每项的期望均方(使用
来源 方差分量 误差项 限制模型)
1 审核员序列 -0.729 3 (4) + 3 (3) + 30 (1)
2 报告序列 417.576 3 (4) + 3 (3) + 9 (2)
3 审核员序列*报告序列 2.363 4 (4) + 3 (3)
4 误差 17.667 (4)
均值
报告
序列 N 扣分值
1 9 17.000
2 9 19.556
3 9 40.444
4 9 8.111
5 9 76.333
6 9 16.556
7 9 13.222
8 9 17.333
9 9 9.000
10 9 20.556
审核员
序列 N 扣分值
1 30 23.900
2 30 23.467
3 30 24.067
单因子方差分析: C17 与 C16
方法
原假设 所有均值都相等
备择假设 至少有一个均值不同
显著性水平 α = 0.05
已针对此分析假定了相等方差。
因子信息
因子 水平数 值
C16 3 1, 2, 3
方差分析
来源 自由度 Adj SS Adj MS F 值 P 值
C16 2 148.67 74.333 14.23 0.005
误差 6 31.33 5.222
合计 8 180.00
模型汇总
R-sq(调
S R-sq 整) R-sq(预测)
2.28522 82.59% 76.79% 60.83%
均值
C16 N 均值 标准差 95% 置信区间
1 3 19.00 2.65 (15.77, 22.23)
2 3 11.333 1.528 (8.105, 14.562)
3 3 20.67 2.52 (17.44, 23.90)
合并标准差 = 2.28522
Tukey 配对比较
使用 Tukey 方法和 95% 置信度对信息进行分组
C16 N 均值 分组
3 3 20.67 A
1 3 19.00 A
2 3 11.333 B
不共享字母的均值之间具有显著差异。
我权限不够,看不到你的附件。
如果我没猜错,这是你要做的项目。目标是减小审核员对同样问题的判断差异....
对于已经存在的数据,我们用方差分析看看审核员之间打分有没有本质差异,因为报告是随机抽取的,审核员也是随机抽取的。具体打分过程我不知道您是怎么安排的,从数据是看,我们假设打分是独立进行的哈。
因为数据平衡,选用方差分析中的“平衡方差分析”,两个因子均为随机变量,模型中加入报告和审核员的交互作用:我分析的结果可能让您失望了:审核员打分没有本质区别!另外方差齐性检验没有发现异常:三个审核员打分的波动是一致的....
方差分析: 扣分值 与 审核员序列, 报告序列
因子 类型 水平数 值
审核员序列 随机 3 1, 2, 3
报告序列 随机 10 1, 2, 3, 4, 5, 6, 7, 8, 9, 10
扣分值 的方差分析
来源 自由度 SS MS F P
审核员序列 2 5.8 2.9 0.12 0.891
报告序列 9 34046.5 3782.9 152.82 0.000
审核员序列*报告序列 18 445.6 24.8 1.40 0.165
误差 60 1060.0 17.7
合计 89 35557.8
S = 4.20317 R-Sq = 97.02% R-Sq(调整) = 95.58%
每项的期望均方(使用
来源 方差分量 误差项 限制模型)
1 审核员序列 -0.729 3 (4) + 3 (3) + 30 (1)
2 报告序列 417.576 3 (4) + 3 (3) + 9 (2)
3 审核员序列*报告序列 2.363 4 (4) + 3 (3)
4 误差 17.667 (4)
均值
报告
序列 N 扣分值
1 9 17.000
2 9 19.556
3 9 40.444
4 9 8.111
5 9 76.333
6 9 16.556
7 9 13.222
8 9 17.333
9 9 9.000
10 9 20.556
审核员
序列 N 扣分值
1 30 23.900
2 30 23.467
3 30 24.067
zhaoliang • 2018-01-20 13:17
pan.baidu.com/s/1qZdcCEg
zhaoliang • 2018-01-20 13:20
是的,是其中测量阶段的部分
zhaoliang • 2018-01-20 14:17
非常感谢,想求教一下,这里用的平衡方差分析和mintab里的质量工具->量具R&R研究是一回事吗?是殊途同归还是因为条件不同,只能用其中之一
zhaoliang • 2018-01-20 14:20
@杨格_Alan:是的,是对10份报告在不同的时间段进行打分。 是不是这样的方式是有缺陷的,因为制造业是对同一零件多次测量,服务业是不是不能用这样的方法?有没有比较理想的设计方法?
zhaoliang • 2018-01-20 14:21
每个审核员对一份报告审核三次(不同时间段)合计审核10份。相当于每个人总计做30次审核动作
杨格_Alan • 2018-01-20 14:23
设计方法应该是随机抽10份报告,让三个审核员“盲测”
杨格_Alan • 2018-01-20 14:25
最好是抽最有经验的审核员打过分的,被测试审核员可以抽有代表性的三个:比如老中青。最好这些审核员没有接触过这些报告。
仅供参考哈
zhaoliang • 2018-01-20 14:25
@杨格_Alan:那这样是不是只能得到不同审核员之间有没有差异,而同一审核员在不同状态下(比如早上和晚上,心情好和心情不好)的一致性就不能验证了
zhaoliang • 2018-01-20 14:28
如果选用量具R&R分析,应该选交叉还是嵌套呢?
zhaoliang • 2018-01-20 14:32
@杨格_Alan:那如果假设某经验丰富的老审核员的审核扣分是标准的,给出一列标准值,用minitab应该用什么方法操作?
zhaoliang • 2018-01-20 14:39
@杨格_Alan:感谢,我学习下你发的资料
zhaoliang • 2018-01-20 15:26
谢谢!