属非参数统计的部分正交试验 向DOE初学者进言(3)

属参数统计范畴的全因子析因设计,费歇在上世纪廿年代在农业DOE上已应用,但在工业上应用滞缓。原因是大于4因子工业案例众多,用全因子析因设计试验次数太多。而能大...

属参数统计范畴的全因子析因设计,费歇在上世纪廿年代在农业DOE上已应用,但在工业上应用滞缓。原因是大于4因子工业案例众多,用全因子析因设计试验次数太多。而能大大减少试验次数的部分正交试验,其所谓主效应混杂交互效应,建数模困难。所以面对工业多因子案例两难局面,欧美学者裹足不前。
到40年代后期,纺织业专家田口玄一忽略部分正交试验的混杂问题,摆脱了非零交互作用必须甪全因子析因设计的束缚, 把部分正交试验用于工业多因子案例,在日本获得巨大成效。但欧美学者称田口方法是 “看不懂的天书”。
后来田口先生亲自在美国大企业,解决不少技术难题后,美国权威DOE文献都把田口稳健性设计列入章节:成功的实践更雄辩。
历史上,国内学者以参数统计理论观点,认为重复试验6次也是小样本,2水平4因子用8次试验样本太小,对其推断的可信度也曾持怀疑态度。北大学者在北京印染厂,现场参与的2水平7因子部分正交试验案例,仅用8次试验,成品率从32%提高到42%,反应时间缩短了近5小时。
实践促使反思理论,北大张里千认为部分正交试验属未知总体的非参数统计系统。
 为了达到回归系数估计最小方差无偏估计,需适合高斯-马尔可夫7项假设;为了回归系数置信区间估计,还需正态分布假设…这都源于追求建回归方程的高目标。
依靠正交表的优良性,如仅以寻找最优水平组合,就可摆脱参数统计的约束。
张里千先生为田口方法找到了理论归属,也为各种非全因子析因设计各种DOE派别正了名。
并且说明正交表的均衝分散性、整齐可比性是小正交表用小样本产生高效能的关键:
如不删除惰性因子,网大易捕捉到冒尖区域;
因子水平间分散距离足够,系统性变异的信号能淹没随机性变异噪声;
每一水平参与试验次数相同,使每一组试验都有相同的统计解释力。
工业上百个参数案例不鲜见,用超饱和设计筛选、用各种非全因子析因设计是必要的,但非全因子析因设计信息不齐的软肋和追求建数学模型的高目标相悖的。
张里千先生为首的北大学者们提出中国特色的《实用优选法》:
用不设交互作用项的小正交表,依照序贯设计思想,用多轮正交试验逐步寻到可能最优组合。
也可同样用于控制,以达到设计要求的均值和方差为目的。
目前DOE学界两条发展方向:
(一)寻找最优水平组合,暂不建数模。作为应用数学,只要知道“是什么”,不必知道“为什么”。
(二)建回归方程为目的。
(1)一种思路是研究最小低阶混杂设计,需用经验因素判断,关键仍不能避免混杂。
(2)另一种思路,删减惰性因子,缩减到3、4因子后再用全因子析因设计建数模。
其缺陷是当试验设计水平不够多、不够广时,在原水平时可能是惰性因子,在原水平外可能是非惰性因子,尤其是非线性响应可控因子。
明明是高维空间模型,武断缩减成低维空间模型,缩减了信息后建立的回归方程,对样本拟合也近似了,离拟合总体更远了。
(3)全因子析因设计信息也不齐。
比如2水平2因子全因子析因设计有4次试验,其仅X1xX2考虑交互作用,但忽略了回归因子可能二次方。如全二阶模型需6个参数待估计,应6次试验。
用小样本估计总体的回归系数可信度有多高?
所以英国统计学家肯德尔指出“样本量n应是解释变量个数p的10倍。”(《应用回归分析》p10)
建回归方程的目的是用于预测或控制,对小样本拟合好的回归方程,不一定对总体拟合好!
所以有学者警示:
“一个模型如果对数据拟合得太好可能对预测是槽糕的。”(《试验设计与分析及参数优化》p13)
收起阅读 »

如何在试验开始前比较所采用的的实验设计的效率

74238 DOE实验设计是重要的改善工具,也是统计学应用于解决实际问题的一门学科。虽然历经近百年的发展,至今仍是最为活跃的...

1.png

DOE实验设计是重要的改善工具,也是统计学应用于解决实际问题的一门学科。虽然历经近百年的发展,至今仍是最为活跃的统计学分支。它的活力主要来自于解决实际问题的有效性。
 
作为工程技术人员,不仅仅是质量工作者,尤其是研发和工艺工程师,经常要进行“试验”,比如:确定公差、选择产品结构、确定工艺参数、调整加工和制造参数等等。有时候,这样的事情多到我们不认为它们是“试验”,而是日常工作的一部分。
 
有经验的工程师会有体会:试验是耗力费时的,更麻烦的是,尽管不断调整和优化过程,有的问题还是反复发生。
 
记得有句话:“不会科学安排试验的工程师,最多只能算半个工程师”。
 
尤其在精益理念盛行的今天,看得见的浪费容易被消除或减少;但,如果不能科学的安排试验,尽管反复试验,其中的浪费确不太容易引起重视。使用科学的方法来安排试验,应该是精益思想的体现吧。
 
还有许多年轻有为的质量工作者在不断学习诸如六西格玛,同时也不断解决所谓的质量问题,也需要掌握DOE的基本技术。特别是黑带项目或者从事黑带工作,熟练运用DOE应该是基本功之一。
 
试验耗力费时,选择实验设计的类型也是很有讲究的:即使同一大类的设计中,不同的设计的“效率”也是不一样的。怎么能采用最少的试验次数获得更多更可靠的信息非常重要。
 

1.png


2.png



  收起阅读 »

利用SPSS软件分析数据正态性

利用SPSS检验数据正态性分布      SPSS作为鼻祖级的统计工具,与MINITAB一样,成为时下最盛行的品质数据分析工具,上学期我们MBA课程也开设了此门...
利用SPSS检验数据正态性分布
     SPSS作为鼻祖级的统计工具,与MINITAB一样,成为时下最盛行的品质数据分析工具,上学期我们MBA课程也开设了此门课程,今天我们来谈谈一个最基本的功能,那就是正态性分布的检定,预备,分析走起!
       正态分布也叫常态分布,日常生活中很多事情的数据分析都符合正态分布。下面的图就是正态分布曲线,中间隆起,对称向两边下降。
 
 
 下面我们来看一组数据,并检验“期初平均分” 数据是否呈正态分布(此数据已在SPSS里输入好)
 
在SPSS里执行“分析—>描述统计—>频数统计表”(菜单见下图,英文版的可以找到相应位置),然后弹出左边的对话框,变量选择左边的“期初平均分”,再点下面的“图表”按钮,弹出图中右边的对话框,选择“直方图”,并选中“包括正态曲线”
 
 
  设置完后点“确定”,就后会出来一系列结果,包括2个表格和一个图,我们先来看看最下面的图,见下图,
 
 上图中横坐标为期初平均分,纵坐标为分数出现的频数。从图中可以看出根据直方图绘出的曲线是很像正态分布曲线。如何证明这些数据符合正态分布呢,光看曲线还不够,还需要检验:
     检验方法一:看偏度系数和峰度系数
     我们把SPSS结果最上面的一个表格拿出来看看(见下图):
 
    偏度系数Skewness=-0.333;峰度系数Kurtosis=0.886;两个系数都小于1,可认为近似于正态分布。
     检验方法二:单个样本K-S检验
     在SPSS里执行“分析—>非参数检验—>单个样本K-S检验,弹出对话框,检验变量选择“期初平均分”,检验分布选择“正态分布”,然后点“确定”。
 
 
     检验结果为:
 
 
    从结果可以看出,K-S检验中,Z值为0.493,P值 (sig 2-tailed)=0.968>0.05,因此数据呈近似正态分布
    检验方法三:Q-Q图检验
    在SPSS里执行“图表—>Q-Q图”,弹出对话框,见下图:
 
 
 
变量选择“期初平均分”,检验分布选择“正态”,其他选择默认,然后点“确定”,最后可以得到Q-Q图检验结果,结果很多,我们只需要看最后一个图,见下图。
 
 
     QQ Plot 中,各点近似围绕着直线,说明数据呈近似正态分布。

    好了好了,今天课程到此结束,各位有问题,记得跟我联系哦!

  收起阅读 »

【品管大实话】单样本T检验

以下均为个人理解,不对之处,请各位多多指正 71298  
以下均为个人理解,不对之处,请各位多多指正

【实话百科】单样本T检验6sq.png

 

1分钟教你制作双因素方差分析

作为一位生物学家,您正在研究生活在两个湖中的浮游动物。您在实验室中放置了十二个容器,每六个容器一组分别装有取自两个湖的水。您在每个容器中添加了三种营养补充物质中...
作为一位生物学家,您正在研究生活在两个湖中的浮游动物。您在实验室中放置了十二个容器,每六个容器一组分别装有取自两个湖的水。您在每个容器中添加了三种营养补充物质中的一种,30 天后对单位体积水中的浮游动物进行计数。您使用双因子方差分析检验总体平均值是否相等,这相当于检验是否有显著证据证明存在交互作用 和主效应 。
 
操作:
1, 6SQ统计--方差分析--双因素方差分析(交叉的)

 
2,输入因素A水平数 3  因素B水平数 2 重复试验次数  2
QQ图片20170216224655.png

3,点击设计输出空白表格
QQ图片20170216224817.png

4,填入实验数据

QQ图片20170216225054.png

5,输入因素A水平数 3  因素B水平数 2 重复试验次数  2
选择全部的红框内数据
QQ图片20170216224655.png

6,点击确认,输出分析结果

QQ图片20170216225248.png

解释结果

双因子方差分析的默认输出为方差分析表 。对于浮游动物数据,如果可接受值小于 0.145(交互作用 F 检验的 p 值 ),则没有显著证据表明存在补充物质*湖水交互作用效应或湖水主效应。当 alpha 水平 为 0.05 时,由于 F 检验 p 值为 0.015,因此有显著证据表明存在补充物质主效应。

Excel数据
http://pan.baidu.com/s/1i5AXSRN​
  收起阅读 »

1分钟教你制作单因素方差分析

您设计了一项试验来评估四种试验性地毯产品的耐用性。您将这些地毯产品中每种的一个样本分别铺在四个家庭,并在 60 天后测量其耐用性。 共四种地毯,每个地毯实验四次...
您设计了一项试验来评估四种试验性地毯产品的耐用性。您将这些地毯产品中每种的一个样本分别铺在四个家庭,并在 60 天后测量其耐用性。
共四种地毯,每个地毯实验四次。

操作:
1, 6SQ统计--方差分析--单因素方差

QQ图片20170216213041.png


2,输入因素水平数 4   试验次数  4

QQ图片20170216215453.png



3, 点击设计,输出表格

QQ图片20170216220006.png


4,填入实验数据

QQ图片20170216221738.png


5,选择上所有红框的内容, 因素水平数 4 试验次数4

QQ图片20170216221843.png


6,点确认,输出分析结果

QQ图片20170216222243.png



在方差分析表 中,地毯的 p 值 (0.047) 表明,有足够证据证明,当 alpha 设置为 0.05 时,并非所有平均值都相等。

Excel数据
 http://pan.baidu.com/s/1i5AXSRN​ 

6SQ统计3.0企业版90天试用下载​ http://pan.baidu.com/s/1i5AXSRN    收起阅读 »

1分钟教你制作双方差检验

为了提高家庭暖气系统的效率,进行了一项旨在评估两种设备功效的研究。安装其中一种设备后,对房舍的能耗进行了测量。这两种设备分别是电动气闸(气闸 1)和热活化气闸(...
为了提高家庭暖气系统的效率,进行了一项旨在评估两种设备功效的研究。安装其中一种设备后,对房舍的能耗进行了测量。这两种设备分别是电动气闸(气闸 1)和热活化气闸(气闸 2)。能耗数据(气闸内置能量消耗)堆叠在一列中,另外还有一个分组列(气闸),包含用于表示总体的标识符或下标。您要比较两个总体的方差,以便构造用于比较两个气闸的双样本 t 检验和置信区间 。 
 
数据:
 
气闸内置能量消耗_1    气闸内置能量消耗_2
7.87    12.28
9.43    7.23
7.16    2.97
8.67    8.81
12.31    9.27
9.84    11.29
16.90    8.29
10.04    9.96
12.62    10.30
7.62    16.06
11.12    14.24
13.43    11.43
9.07    10.28
6.94    13.60
10.28    5.94
9.37    10.36
7.93    6.85
13.96    6.72
6.80    10.21
4.00    8.61
8.58    11.62
8.00    11.21
5.98    10.95
15.24    7.62
8.54    10.40
11.09    12.92
11.70    15.12
12.71    13.47
6.78    8.47
9.82    11.70
12.91    7.73
10.35    8.37
9.60    7.29
9.58    10.49
9.83    8.69
9.52    8.26
18.26    7.69
10.64    12.19
6.62    5.56
5.20    9.76
*    7.15
*    12.69
*    13.38
*    13.11
*    10.50
*    14.35
*    13.42
*    6.35
*    9.83
*    12.16
 
操作:
1, 6SQ统计--估计和假设检验--双方差检验

 
2, 选择样本1数据列和样本2数据列 

QQ图片20170214231413.png

3, 确认,输出结果

QQ图片20170214231625.png


输出结果_SixSQStat_StDevCIChart.jpg


输出结果_SixSQStat_VarCIChart.jpg

解释结果

方差检验会生成一个图,该图显示两个因子水平的总体标准差的 95% Bonferroni 置信区间。该图形还显示两个样本的原始数据的并列箱线图。最后,在会话窗口和图形中都给出了 F 检验和 Levene 检验的结果。当数据来自正态分布时解释 F 检验,当数据来自连续但不一定正态的分布时使用 Levene 检验。请注意,95% 置信区间适用于区间族,区间的非对称性是由卡方分布的偏度造成的。

对于该能耗示例来说,p 值 0.558 和 0.996 都大于 a 的合理选择范围,因此无法否定方差相等的原假设 。也就是说,这些数据并未提供足够证据证明两个总体的方差不相等。因此,使用双样本 t 过程时假定方差相等是合理的。 
excel案例数据
http://pan.baidu.com/s/1i5AXSRN​
  收起阅读 »

1分钟教你制作单方差检验

您在一家制造飞机发动机的高精度部件(包括测量长度必须为 15 英寸的金属销栓)的工厂任质量控制检验员。安全法规定,销栓长度的方差不得超过 0.001in2。以前...
您在一家制造飞机发动机的高精度部件(包括测量长度必须为 15 英寸的金属销栓)的工厂任质量控制检验员。安全法规定,销栓长度的方差不得超过 0.001in2。以前的分析表明,销栓长度服从正态分布。您收集了 100 个销栓的样本,并对其长度进行了测量,以便进行假设检验并为总体方差创建一个置信区间。

销长度
14.99
15.01
14.96
15
15.03
14.96
14.99
14.96
14.96
15.05
15.03
15.05
14.99
14.98
14.94
14.96
14.97
15.02
14.95
15.02
15.02
14.98
15
15
14.95
14.99
14.98
15.01
14.95
14.96
15.05
15.01
15.04
14.97
14.98
14.99
14.95
14.98
14.98
15
15
15
14.97
14.99
15.02
14.96
14.96
15.01
15.01
15
14.97
15.02
15.02
15.01
15.03
14.98
15.01
15
15.02
15.03
15.01
14.98
14.96
14.97
14.97
14.99
14.99
14.96
15.03
14.99
14.98
14.99
15.03
15.02
15
15.01
15.02
15
14.95
14.97
15.01
14.96
15
14.95
15.03
15.03
14.99
15
15.01
14.97
14.99
15
14.97
15.02
15
14.97
14.96
15
14.99
14.94
 
操作:
1, 6SQ统计--估计和假设检验--单方差检验

 
2, 选择方差  填入假设方差0.001 
选择样本数据
备择假设选择小于

QQ图片20170214160249.png

3, 点确定,输出结果

QQ图片20170214160336.png

 

Sheet7_SixSQStat_VarCIChart.jpg

 
解释结果

由于数据来自正态分布总体,因此请参考卡方方法。单侧假设检验的 p 值为 0.014。此值足够低,可以否定原假设,并可推断销长度的方差小于 0.001。通过考查 95% 的置信上限,可以使总体方差的估计值更确切,该置信上限提供总体方差可能低于的值。从此分析中应该能推断出,销栓长度的方差足够小,可以满足规范并确保乘客安全。
 
Excel案例数据
http://pan.baidu.com/s/1i5AXSRN​
  收起阅读 »

【原创】方差分析原理解析

潜水很长时间,第一次发帖请多关照。今天是元宵佳节,祝大家团团圆圆,元宵节快乐安康。 在论坛中潜水期间,学习到了很多专业人士的卓越见解,因此也希望所学所获能与大家...
潜水很长时间,第一次发帖请多关照。今天是元宵佳节,祝大家团团圆圆,元宵节快乐安康。
在论坛中潜水期间,学习到了很多专业人士的卓越见解,因此也希望所学所获能与大家分享,算是一种感恩与回馈。
文章来自微信公众号“Excel与Minitab”大家不要误会,并非广告贴,只因微信公众号的文章能插入动态图片便于阅读与在Minitab中操作。原文链接如下就不显示了。
我们比较两个正态样本时可以采用假设检验,如果我们要比较三个样本是否有差异时,例如我们要比较三个供应商提供的同一类型的零件强度是否有明显差异,在我们用双样本假设检验进行两两比较,甲乙,甲丙,乙丙,需要比较三次,且置信水平为0.95%3=85.7%,如果我们比较更多的样本时,比较的数量以及置信区间均无法满足我们的需求,这时假设检验已经无法适用,在此我们引入方差分析的方法比较多个均值是否一致。因此方差分析的前提条件与双样本假设检验的前提条件是一致的,即满足:1,每一个总体的分布需要符合正态分布 2,各正态总体的方差相等 3,确保数据的独立性。
现实中,我们理解的方差分析不仅仅用于多个等方差正态总体的均值之间的比较;当我们怀疑某个变量(X)对结果(Y)可能存在影响时,我们需要在不同的X下,例如对X分别取值X1,X2,X3(X的三种水平下重复试验)比较与之对应的Y1,Y2,Y3,然后我们使用方差分析比较Y1,Y2,Y3的均值,以确定X对于Y来讲是否为一个有影响的因素,试想如果X对Y没有影响,不论X取什么值,只要其他条件不变输出Y都应该是差不多的,用专业的统计术语即试验的观测值Y们之间的均值没有显著差异,因此方差分析是我们找寻关键因素的关键。
基于上述三个基本条件,我们在单因子ANOVA分析过程中其实就是比较多个等方差的正态分布他们的均值有无显著差异,如果H0成立,各水平下的均值无显著差异,如下图,分布均值的Gap很小;

2anvoa.jpg

如果H1成立,即各水平下的均值不完全相同,如下图,分布均值的Gap很大。

1anova.jpg

其分析原理:

(组间方差/自由度A):(组内方差/自由度e)服从F分布--我们在《三类等方差检验》一文中讲过F分布,两个独立的卡方分布(正态分布的平方和)除以各自自由度服从F分布,我们在此用于方差分析,如果F值落入拒绝域,认为Gap足够大,即该因子影响显著。注意其中组间偏差的自由度fA=水平数r-1,组内偏差自由度=试验总次数n-水平数r。
读到这里,也许你已经完全明白了,也许还不是太明白方差分析的原理,我们比较均值最终是通过比较方差来实现的,为什么?为什么方差分析法可以分析各样本均值是否相等?通过5WHY我们再理一理其中的逻辑,如下图:

1.jpg

通过一个例子我们再次理解一下上述5WHY图中所述的随机误差与系统误差。
判断温度是否对产出有影响,在4个不同温度下分别进行了5次试验

捕获1.JPG

 
我们看到即使在同一温度下,例如60度下的五个产出值并不完全一样,因为过程受到一些随机因素的影响,这时实测值与理论真值(我们通常认为平均值接近于理论真值故实际计算时用均值代替,下文的均值等同于理论真值)的偏离(方差)为随机误差,同一温度下各测量值与该温度下均值的方差又称之为组内方差,所以组内的方差只包含随机误差;我们再来看不同温度下的产出值,它们的均值上的差异时由于温度不同造成的,我们称之为系统误差,从数据上来看,不同温度组的产出值的组间方差既有不同温度带来的系统误差,也有随机因素造成的随机误差。如果该因素“温度”并不影响产出的话,那么组间方差中的系统误差部分应该接近于0,那么总的组间方差应该会接近于总的组内方差(组内方差只含随机误差),二者的比值就接近于1;反之,如果该因素对于输出有显著影响的话,组间方差则主要由系统误差构成,总的组间方差与总的随机方差的比值就比较大,而且该值越大因子效应越显著。根据前文统计基础《三大分布》中所述,两组方差与自由度之比(两卡方分布之比)符合F分布,因此方差分析的统计量为F值=(组间方差/自由度A):(组内方差/自由度e),拒绝域临界值为F1-α(dfA,dfe)。
相关案例如何在Minitab中操作,由于无法显示动态gif图片,就在本文省略了。文章不足之处,欢迎大家批评指正,谢谢。圣人云:“君子以文会友,以友辅仁”,Email:[email]neverlookbackxjy@163.com[/email]


  收起阅读 »

1分钟教你制作双比例检验

作为公司的采购经理,您需要授权采购二十台新复印机。在根据价格、复印质量、保修和功能对多个品牌进行比较后,将选择范围缩小到两个品牌:X 品牌和 Y 品牌。您认为决...
作为公司的采购经理,您需要授权采购二十台新复印机。在根据价格、复印质量、保修和功能对多个品牌进行比较后,将选择范围缩小到两个品牌:X 品牌和 Y 品牌。您认为决定性因素是品牌的可靠度,定义为在购买后一年内需要维修的比率。

由于您的公司已经使用过这两种品牌,因此可获得每种品牌随机选择的 50 台机器的维修历史记录信息。记录显示,六台 X 品牌的机器和八台 Y 品牌的机器需要维修。使用此信息可以指导您选择要购买的品牌。
 
操作:
1, 6SQ统计--估计和假设检验--双比例检验

 
2, 比例1 分母输入 50  事件数输入 6  
    比例2 分母输入 50  事件数输入 8
 备择假设选择  不等于

QQ图片20170208183835.png

 
3, 确认输出结果

QQ图片20170208184209.png


Sheet4_SixSQStat_StDevCIChart.jpg

解释结果

对于此示例,正态近似检验有效,因为对于两个样本而言,事件数都大于四,试验数与事件数之间的差值也大于四。正态近似检验报告 p 值 为 0.564,Fisher 精确检验 报告 p 值为 0.774。这两个 p 值都大于通常选择的 a 水平 。因此,数据与总体比率相等的原假设一致。换句话说,在第一年内需要维修的复印机比率不因品牌不同而存在差异。作为采购经理,您需要根据别的标准来决定采购哪种品牌的复印机。

由于正态分布有效,因此从 95% 置信区间 中可以得出相同的结论。由于零位于置信区间(-0.0957903 至 0.175790)之内,因此可以得出结论,数据与原假设一致。如果您认为置信区间太宽,并且未提供有关 p1-p2值的精确信息,则可能需要收集更多数据才能获得差值的更好估计。
 
Excel案例数据
http://pan.baidu.com/s/1i5AXSRN​
  收起阅读 »

Johnson变换的详细算法与在Excel中的实现

文章内容请看附件Word文档和Excel文档   注意:此文档仅供交流和学习,请勿用于商业用途。    
文章内容请看附件Word文档和Excel文档
 
注意:此文档仅供交流和学习,请勿用于商业用途。
 
 

假设检验——狄仁杰断案的秘密

一、狄仁杰断案如神,有什么秘密? 狄仁杰刚到大理寺,积压的案件已非常多。他一心扑在工作上,夜以继日,笔不停批,整整奋战了一年,就把积压案件全都清理...
一、狄仁杰断案如神,有什么秘密?
狄仁杰刚到大理寺,积压的案件已非常多。他一心扑在工作上,夜以继日,笔不停批,整整奋战了一年,就把积压案件全都清理了,涉案人员达17000人之多,事后竟然一个喊冤的都没有。数量之多,质量之好,在当时传为佳话。狄仁杰这么”神”,有什么方法可借鉴吗?

04.jpg


其实狄公断案并不“神秘”,而是有严格的“套路”的,“假设检验”就是其断案的“秘密”。狄仁杰接案后首先做的就是分析案件的现象,而后做出各种“假设”。但他不会按照“假设”断案,而是搜集查找能验证这些“假设”的证据,包括到案发现场实施勘查,用以“检验”以前所做的“假设”,必要时甚至还实施“仿真”复现。例如在《神探狄仁杰1》的《蓝衫记》中,狄公给刘员外再现并放大了他曾亲眼所见的刘公子调戏莹玉的那一幕真相。原来刘员外看见的所谓调戏,实际上是刘公子在为莹玉掸去身上的蜜蜂,可在刘员外藏身的位置看,却像是搂抱。蜜蜂越聚越多,公子只能帮她脱下外衣并仍掉。所谓刘公子调戏继母,实是新夫人莹玉制造的一个弥天大谎。

由此看狄公断案,“事后竟然一个喊冤的都没有”也就不足为怪了。众所周知,法官断案有两种错误可能:一是把清白的人投入监狱,这就犯了第一类错误(α风险),二是把罪犯放了,那么就犯了第二类错误(β风险)。要减少这两类错误的最佳方法在于证据的数量和质量,恰恰狄仁杰牢牢掌握住了这个关键点。

02.jpg


二、六西格玛:验证根因就是指正罪犯
在六西格玛中,我们要改善流程,首先要验证根因,而验证根因就像指正罪犯一样,需要用数据说话。用数据说话的方法就是统计学上的“假设检验”。跟法官判案类同,如果我们把不影响流程的因子确定为要因,则犯了第一类错误(α风险),结果是改善没有效果;反之,如果我们把根因排除了,则犯了第二类错误(β风险),结果是丧失了改善机会。
假设是否正确,要用从总体中抽出的样本进行检验,与此有关的理论和方法,构成假设检验的内容。设M是关于总体分布的一项命题,所有使命题M成立的总体分布构成一个集合H0,称为原假设(也称为“零假设”)。使命题M不成立的所有总体分布构成另一个集合Ha,称为备择假设(或称为“对立假设”、“研究假设”,也记为H1)。

法律上的零假设就是无罪推定,在法官做出有罪判决之前所有人都是无罪的,涉案人员只能成为“犯罪嫌疑人”,而不是“罪犯”。统计学上的零假设是没有差异、没有变化的假设,即假设因子不是“要因”。

假设检验的基本思想是小概率反证法原理。小概率原理是指小概率事件(常用概率值为0.01或0.05)在一次试验中由于概率太小应该不会发生。反证法原理是先提出假设(原假设H0,不发生),再用适当的统计方法确定假设成立的可能性大小(P值),如可能性小,则拒绝H0(接受Ha,发生);若可能性大,则不能拒绝H0。

“把不影响流程的因子确定为要因”即当H0为真,但被错误地拒绝,这正是α风险(也称显著水平)。因此:
1)    P值<α,拒绝零假设,所验证的因子是要因。
2)    P值≥α,接受零假设,所验证的因子不是要因。
三、假设检验的应用
在六西格玛改善中,我们利用假设检验的方法验证根因。具体的假设检验方法取决于数据的类型。如下图所示:

03.jpg


假设检验的步骤:
1)    建立零假设和备择假设;
2)    决定显著性水平(α);
3)    随机抽取数据;
4)    计算P值;
5)    比较P值和α,得出结论。

以上假设检验的方法能够使我们对于流程根因的判断用数据说话,做出科学的判断,使主观判断的风险最小化,能够像狄公那样既不冤枉好人,也不放过坏人。

本文作者:王贺东
科理咨询副总裁、首席顾问;精益六西格玛黑带大师;在流程改进、六西格玛推进及精益改善领域有25的现场工作经验;超过15年的专业管理咨询经验;尤其擅长项目管理,帮助促进项目的成功实施;培训超过500名的黑带大师,5000名绿带/黑带;辅导绿带/黑带项目超过5000个,帮助企业取得了数以亿元的财务收益。服务过华润集团、红塔集团、蒙牛乳业、中国南车、中兴通讯、比亚迪、美的集团、武钢集团等众多知名企业。
 
——转载自微信公众号“科理咨询”,转载引用请先获得授权。 收起阅读 »

“爹矮矮一窝”的说法正确吗?相关分析法告诉你!

70445   全世界父母关注的事         没有听说哪个父母希望孩子越矮越好,都希望子女““...
小矮人.jpg

 全世界父母关注的事
        没有听说哪个父母希望孩子越矮越好,都希望子女““高大上”。但中国民间一直流传着这样的说法。“娘矮矮一个,爹矮矮一窝”,这句话靠谱吗?

父子.jpg


       其实,这种困扰不止在中国有,在外国也有。为此,一百多年前(1900年前后),人类学家、优生学家、英国皇家学会院士佛朗西斯.高尔顿(Francis Galton)爵士和有统计学之父尊称的卡尔·皮尔森(Karl Pearson)等人对此进行了调查研究。他们对英格兰市民进行了抽样调查,得到1078对成年父子身高的数据,并画出以下散点图:

相关分析1.jpg


       从这个图形可以看到,随着父亲身高变高,儿子的身高确实有变高的趋势。我们把一个连续变量(y)随着另外一个连续变量(x)增加而增加或减少的现象叫做相关。如果y随x增加而增加,就称y与x为正相关;如果y随x增加而减少,就称y与x为负相关。儿子的身高与父亲的身高即为正相关关系,即:父亲身高高的话,儿子身高就会高。
 
另一方面,我们也看到,儿子身高随父亲身高增加得并没有那么紧密。请下图:

相关分析2.jpg


       当父亲身高为70英寸时,儿子身高从63英寸到74.5英寸都有可能,其变化范围多达11.5英寸。换句话说,儿子身高与父亲身高的相关性并没有那么强!为此皮尔森定义了相关系数(即皮尔森系数,总体用ρ,样本用r标示),以表达变量间的相关强度。

相关分析3.jpg


       相关系数的取值范围为(-1,1),r的绝对值越大,相关性就越强。r=1为完全正相关,r=-1为完全负相关,r=0意味着没有线性相关关系。

相关分析4.jpg


       经过计算,这1078对父子身高的相关系数r=0.419,属于偏弱的相关性。那么结论就出来了,父亲的身高确实对儿子的身高有影响,但影响比较弱。看来“爹矮矮一窝”的说法并不靠谱!千百年来,父亲们受到了很多错怪,承受了很多不公正的压力!

相关性分析的基本方法

        相关分析是针对连续变量之间的关系进行分析。其基本分析方法为散点图和相关系数。散点图就是把两个变量的坐标点画在直角坐标系中,观察其形状,以判断其相关属性:正相关、负相关和不相关(无线性相关)。从这些点的集中和离散程度可以判断其相关强度。但这样判断相关强度并不准确,因此相关系数是判断相关强度的准确方法。

       但不能仅仅依靠相关系数判断变量间的相关强度。下图中4对变量的散点图各不相同,但它们的相关系数均为0.816。因此相关分析必须是先分析散点图,再计算相关系数,否则可能得到错误的结论。

相关分析5.jpg


相关分析的注意事项

 相关不一定有因果分析。研究指出,医院规模增加,病人死亡率亦显著提升。这么说来,我们应该避免去大型医院就诊吗?显然这是一个不合理的结论。

相关分析6.jpg


相关关系不能外推。相关关系的存在只限于研究的范围,把相关关系的结论外推到超出研究的范围,可能导致错误的结论。如二手汽车的售价会随着车龄增加而降低,车的售价与车龄属于负相关的关系。但这个结论一般只在一定的车龄范围内有效,超过一定的车龄范围(如50年),售价和车龄的关系未必就是负相关关系了,也许变成正相关关系。

相关分析7.jpg


异常点的处理。出现异常点时,要调查原因,再进行处理。不处理异常点或直接把异常点删除都可能导致错误的后果。
相关分析8.jpg


版权声明:本文由科理咨询原创,版权归属科理咨询,抄袭必究。
  收起阅读 »

1分钟教你制作单比例检验

县地区检察官想竞选州地区检察官职位。她已决定,如果她的党派成员中支持她的人超过 65%,她就放弃县检察官职位,而竞选州检察官职位。您需要检验 H0:p = .6...
县地区检察官想竞选州地区检察官职位。她已决定,如果她的党派成员中支持她的人超过 65%,她就放弃县检察官职位,而竞选州检察官职位。您需要检验 H0:p = .65 与 H1:p > .65。 

作为竞选活动管理者,您收集了 950 名随机选择的党派成员的数据,并发现有 560 人支持该候选人。您进行了一项比率检验,以确定支持者的比率是否大于必需比率 0.65。此外,还构造了 95% 的置信限,以确定支持者比率的下限。
操作:
1, 6SQ统计--估计和假设检验--单比例检验

 
2, 试验数输入 950  事件数输入 560  假设比例为 0.65
 备择假设选择  大于

a07ae7d55cecfdddc11492ece485b621.png


3, 确认输出结果

98c2dcdd9926a72ccefdc546f1516e23.png


6d4edbb05416ff5cb820b756f54827d1.jpg


 
解释结果

p 值 1.0 表示,数据与原假设一致(H0:p = 0.65),即支持候选人的党派成员的比率不大于 0.65 这一必需比率。作为活动管理者,您建议她不要竞选州地区检察官职位。
  收起阅读 »

1分钟教你制作双样本t检验

为了提高家庭暖气系统的效率,进行了一项旨在评估两种设备功效的研究。安装其中一种设备后,对房舍的能耗进行了测量。这两种设备分别是电动气闸 和热活化气闸 。能耗数据...
为了提高家庭暖气系统的效率,进行了一项旨在评估两种设备功效的研究。安装其中一种设备后,对房舍的能耗进行了测量。这两种设备分别是电动气闸 和热活化气闸 。能耗数据(气闸内置能量消耗)堆叠在一列中,另外还有一个分组列(气闸),包含用于表示总体的标识符或下标。假设进行了方差检验,并且没有发现方差不等的证据(请参见双方差示例)。现在,您要确定是否有证据证明这两种设备之间的差值不为零,以比较出这两种设备的功效。
数据如下:
 
热活化气闸 电动气闸
13.07 8.25
7.6 9.66
3.2 8.33
9.28 8.82
9.73 12.06
11.73 9.67
9.67 17.51
10.76 10.79
11.05 13.59
17.63 7.99
15.58 12.64
12.53 14.42
11.87 9.25
14.19 7.79
6.84 11.29
11.89 10.26
7.41 9.46
7.42 14.77
10.83 7.21
9.44 4.29
12.94 9.81
13.15 8.41
11.69 6.78
7.73 16.3
11.94 9.01
13.62 11.41
17.07 12.37
14.66 13.28
9.56 7.24
12.37 10.55
8.33 13.89
8.67 10.72
11.27 9.22
11.67 10.61
9.37 10.04
8.93 10.2
8.41 20.55
12.85 11.75
5.27 7.08
10.02 5.5
7.87
11.82
14.42
13.69
10.77
15.26
14.53
6.84
10.92
13.05
 
操作:
1, 6SQ统计--估计和假设检验--双样本t检验

 
2,置信水平输入 95% 选择样本1和样本2数据列
 备择假设选择 不等于 . 图表选择 数据单值图。

QQ图片20161007124940.png

3,点击确认输出结果:

QQ图片20161007125955.png


Sheet5_SixSQStat_IndivadualPlot.jpg

解释结果

由于以前没有发现方差不等的证据,因此我们通过选中假定等方差选择了使用合并标准差。合并标准差 2.8818 用来计算检验统计量和置信区间 。

第二个表给出了总体均值之间差值的置信区间。对于此示例,95% 置信区间为 (-1.450, 0.980),其中包含零,这表明不存在差异。接下来是假设检验 结果。检验统计量为 -0.38,p 值为 0.701,自由度 为 88。

由于 p 值 大于通常选择的 a 水平 ,因此,没有证据证明,使用电动气闸与使用热活化气闸在能耗上有差异
 
Excel数据案例
http://pan.baidu.com/s/1i5AXSRN​
  收起阅读 »

1分钟教你制作单样本t检验

对九个小配件进行了测量。根据历史经验,小配件的测量数据的分布接近于正态,但假设不知道 s。为了检验总体均值是否为 5 并获得均值的 90% 置信区间,需要使用 ...
对九个小配件进行了测量。根据历史经验,小配件的测量数据的分布接近于正态,但假设不知道 s。为了检验总体均值是否为 5 并获得均值的 90% 置信区间,需要使用 t 检验。
数据如下:

4.9
5.1
4.6
5.0
5.1
4.7
4.4
4.7
4.6
 
操作:
1, 6SQ统计--估计和假设检验--单样本t检验

2,置信水平输入 90% 假设均值 5   
 备择假设选择 不等于 . 图表选择 数据单值图。

QQ图片20161006155356.png

3,点击确认输出结果:

QQ图片20161006155448.png


输出结果_SixSQStat_IndivadualPlot.jpg

解释结果

对于 H0:m = 5,检验统计量 T 的计算结果为 -2.56。

此检验的 p 值 或在原假设为真时获得检验统计量的更接近的极值的概率为 0.034。这称为达到的显著水平 或 p 值。因此,如果可接受的 a 水平大于 p 值或 0.034,则否 H0 。

总体均值 m 的 90% 置信区间 为 (4.6357,4.9421)。此区间略宽于单样本 Z 示例中显示的对应 Z 区间。
 
excel案例数据
http://pan.baidu.com/s/1i5AXSRN​ 

6SQ统计3.0企业版90天试用下载​ http://pan.baidu.com/s/1i5AXSRN    收起阅读 »

1分钟教你制作单样本Z检验

对九个小配件进行了测量。您知道,根据历史经验,测量值的分布接近于正态,且 s = 0.2。由于已知 s,并且要检验总体均值是否为 5 并获得均值的 90% 置信...
对九个小配件进行了测量。您知道,根据历史经验,测量值的分布接近于正态,且 s = 0.2。由于已知 s,并且要检验总体均值是否为 5 并获得均值的 90% 置信区间,因此使用 Z 检验。
 
数据如下:

4.9
5.1
4.6
5.0
5.1
4.7
4.4
4.7
4.6
 
操作:
1, 6SQ统计--估计和假设检验--单样本Z检验

QQ图片20161006152547.png

 
2,置信水平输入 90% 假设均值 5  总体标准偏差0.2 
 备择假设选择 不等于 . 图表选择 数据单值图。
QQ图片20161006153358.png

 
3,点击确认输出结果:
QQ图片20161006153630.png


Sheet4_SixSQStat_IndivadualPlot.jpg

解释结果

用于检验总体均值是否等于 5 的检验统计量 Z 为 -3.17。p 值 或在原假设为真时否定原假设的概率为 0.0015。这称为达到的显著水平 、p 值或检验达到的 a。由于 p 值 0.0015 小于通常选择的 a 水平 ,有显著证据表明 m不等于 5,因此否定 H0,支持 m 不等于 5。

通过查看单值图还可以执行 a = 0.1 时的假设检验 。假设值落于总体均值的 90% 置信区间 (4.6792, 4.8985) 之外,因此可以否定原假设。

excel案例数据
http://pan.baidu.com/s/1i5AXSRN​
  收起阅读 »

有个质量人说我已经知道下任美国总统是谁了!

69819  [code]根据CNN周一(7月25日)公布的最新民调,有44%的被调查者支持特朗普担任下届美国总统,39%的...

cdfedc7f61a7324_w706_h393.jpg

 
根据CNN周一(7月25日)公布的最新民调,有44%的被调查者支持特朗普担任下届美国总统,39%的人支持希拉里,加里·约翰逊(前墨西哥州州长、美国自由党总统参选人)和吉尔·斯泰因(代表绿党参加总统选举)的支持率分别为9%和3%。而在另一项只有希拉里和特朗普两个人的调查中,特朗普也以48%的支持率超过希拉里(支持率为45%)。
此次民调显示,就算在个人形象上,特朗普也更加高大了。

有52%的人表示,他们相信特朗普竞选总统是为了国家的利益而不是出于私利,只有44%的人相信“狡猾的希拉里”是这样的。
据报道,此次民调是7月22日至24日间进行的,CNN通过电话随机采访了美国国内1001位成年人,其中有882名登记选民的样本。

这个是CNN最近调查的数据,普通人看新闻看到的是48%比45%大 3%,特朗普是领先的。

我们质量人不能这样看,这不科学!在882的样本中,3%的差距是否能证明两人的支持率是存在显著的差异?

当然我们质量人也想知道未来的美国总统是谁,这并不难,几分钟的事情, 行动起来。。。

从上面的数据,我们知道未来的美国总统肯定是希拉里或特朗普二选一。

于是先整理了下数据!

候选人 支持率 支持人数
特朗普 48% 423
希拉里 45% 397
总调查人数 882

我们想知道从调查结果中希拉里与特朗普的支持率是否有显著的差异。
我们使用双比例假设检验:

零假设(或原假设)为:特朗普与希拉里的支持率是一样的

备择假设(或对立假设)为:特朗普与希拉里的支持率不一样


一,打开 6SQ统计3.0 --估计和假设检验--双比例检验

未命名-1.jpg

二,输入对应的数据 (如下图), 备择假设选择不等于.
未命名-2.jpg

三,点击确定输出分析结果:

未命名-3.jpg

6SQ统计插件可以直观的显示分析结论:接受零假设

通俗的来说,通过这个调查数据分析,特朗普与希拉里的支持率无显著差别。

我们无法判断谁会当选为总统。

但我们注意到以下信息:

此次民调显示,就算在个人形象上,特朗普也更加高大了。

有52%的人表示,他们相信特朗普竞选总统是为了国家的利益而不是出于私利,只有44%的人相信“狡猾的希拉里”是这样的。


我们来看看数据两人在被相信率上是否有明显的差异。

候选人 被相信率 相信人数
特朗普 52% 459
希拉里 44% 388
总调查人数 882

同样我们使用双比例假设检验:

零假设(或原假设)为:特朗普与希拉里的被相信率是一样的。
备择假设(或对立假设)为:  特朗普与希拉里的被相信率不一样.

一,打开6SQ统计3.0 --估计和假设检验--双比例检验

二,输入对应的数据(如下图 ),备择假设选择不等于.

未命名-4.jpg


三,点确定输出结果

未命名-5.jpg


6SQ统计插件可以直观的显示分析结论: 拒绝零假设。

接受备择假设。

特朗普与希拉里的被相信率有显著性差异。

特朗普的被相信率比较高。

所以我们相信在投票时,特朗普会占优势,当选总统的可能性要高于希拉里.

说明:本次抽查的数据的分析结论,只在抽查的时间段是有效的,美国大选是在11月进行,后期各个候选人会再出大招,会产生各种变数,到时必须再抽查分析。

 小贴士: 
 
假设检验(Hypothesis Testing)
是数理统计学中根据一定假设条件由样本推断总体的一种方法。
具体作法是:根据问题的需要对所研究的总体作某种假设,记作H0;选取合适的统计量,这个统计量的选取要使得在假设H0成立时,其分布为已知;由实测的样本,计算出统计量的值,并根据预先给定的显著性水平进行检验,作出拒绝或接受假设H0的判断。
常用的假设检验方法有u—检验法、t检验法、χ2检验法(卡方检验)、F—检验法,秩和检验等。 收起阅读 »

[荐]质量控制与质量改进中的统计方法

而今,统计分析方法已经被广泛应用于质量控制与质量改进中,成为质量持续改进和六西格玛的重要方法论之一,常用的方法论包括统计过程控制(SPC: Statistica...
而今,统计分析方法已经被广泛应用于质量控制与质量改进中,成为质量持续改进和六西格玛的重要方法论之一,常用的方法论包括统计过程控制(SPC: Statistical Process Control)、实验设计(DOE: Design Of Experiments)和可接受抽样(Acceptance Sampling)以及其他对分析质量问题和改进过程有帮助的方法。

过程模型
很多用于质量控制与质量改进的统计方法可以用下图来说明。在这里,生产或服务过程(Process)被看成一个具有一系列输入(Inputs)和输出(Outputs)的系统,而输入有分为可控输入(Controllable Inputs)和不可控输入(Uncontrollable Inputs)两种。对生产过程而言,可控输入因素(x)包括(比如)温度、压力、进给率等,而不可控输入(z)包括(比如)环境变量、外部供应商所供应的原材料的某个质量指标的变化等,生产过程将原材料、零部件或组件转变成具有某些质量指标(y,过程和产品质量的测量结果)的最终产品。

图:过程的输入和输出
InputsAndOutputs.png


上述模型同样适用于非生产过程和服务过程。例如,在处理汽车贷款申请的金融机构,过程的输入包括贷款申请,其中包含了客户的基本信息及其信用历史记录、汽车种类和价格、申请贷款的金额等,可控因素包括贷款申请的处理人员所接受的培训的种类,该金融机构对该种贷款申请的政策以及一段时间内处理该种贷款申请的人员数量等,不可控因素包括市场利率、能用于发放该种贷款的资金量以及一段时间内需要处理的该种贷款申请的数量等。过程的输出质量因素包括该笔贷款的处理结果(是否被批准),申请者实际接收的已被批准的贷款数量以及周期时间(客户需要等待期贷款申请批复结果的时间)——在服务过程中,周期时间通常都是非常重要的CTQ(Critical To Quality)。

统计过程控制(SPC)与控制图(Control Charts)
控制图是统计过程控制的基本方法。下图是一个典型的控制图的例子,控制图将从生产过程中抽取的样品的某个质量特性的均值,按时间(或样本编号)顺序在图上打点。控制图上包含中心线(CL)、上控制限(UCL)和下控制线(LCL),其中中心线表示当过程中没有特殊的波动源时该质量特性应该在的位置。上下控制限的计算包括了简单的统计学考虑。控制图的典型应用是适用于上述系统的输出变量,但有时将其适用于输入变量也是非常有用的。

图:一个典型的SPC控制图
ControlCharts.png


控制图是一项非常有用的过程控制技术,当特殊的波动源出现时,样本均值点会落到控制限以外,这是一个非常重要的信号,表示我们需要对过程进行调查并采取纠正措施以消除这些特别波动源。系统地使用控制图是降低过程波动的一项完美的措施。另外,相对于离线、事后的SPC分析而言,在线、实时的SPC过程监测能帮助尽早发现质量风险,形成对质量风险的快速相应机制,对企业的帮助更大。

实验设计(DOE)与分析
一个设计好的实验对于发现那些对过程中我们感兴趣的质量特性产生影响的关键变量是及其有帮助的,它能够系统地改变过程中的可控输入变量,并确定这些输入变量对过程输出变量的产生的影响的效果。对于降低质量特性的波动、确定可控变量在何种水平下可以最优化过程是极其有用的,它通常能帮助我们带来流程效能和产品质量的突破。一种主要的实验设计方法是因子实验(Factorial Design)。在因子实验中,各种因素一同变动,这些变动中的所有组合都被一一检验。经验和实际应用表明,这些组合中的一部分能够比另一部分带来更加好的结果。

实验设计方法是一种主要的离线(Off-Line)质量控制工具,因为它们常常被应用在研发实践中和生产过程的早期,而不是作为一种在线(On-line)或在程(In-Process)的常规工具。它在降低过程的波动方面扮演者重要的角色。

一旦我们找到了对过程输出产生影响的重要变量,通常就有必要对有影响力的输入变量和输出变量之间的关系进行建模。这时,有用的统计分析方法包括回归分析和时间序列分析等。而一旦我们找到了重要的输入变量并对它们如何影响输出变量进行了量化,在线的统计过程控制技术就能够用来十分有效地对过程进行监测,它能够帮助实时监测过程的输出,并侦测何时需要调整输入变量来使过程输出保持在受控的状态,而前述的输入变量与输出变量之间的关系的模型能帮助我们确定需要调整何种输入变量以及需要调整多大的幅度。

在很多过程中,一旦输入变量和输出变量之间的关系的动态特性能够得以理解和确定,就可以定期调整过程以使将来的过程输出大体上符合目标值。这种定期的调整通常称为工程控制(Engineering Control),自动控制(Automatic control)或反馈控制(Feedback control)。而统计过程控制(SPC)技术通常能够有效地整合到进行工程控制的制造系统中去。

可接受抽样(Acceptance sampling)
可接受抽样(Acceptance Sampling)技术与产品的检验和测试尽力联系在一起,它是一种早期的质量控制方法,在统计方法应用在质量控制领域之前很久就已经产生了。检验能够在过程中的很多点实施。可接受抽样被定义为从大批量中随机抽取的样本的检验(Inspection)和分类(Classification)结果以及根据这一结果对该批量进行的处置措施,它通常发生在两个地方:来料检验和最终产品。常见的几种可接受抽样的情形如下图所示。

图,可接受抽样的几种情形
CasesOfAcceptanceSampling.png


被抽样的批次要么会被拒绝,要么会被接受。而对被拒绝的批次中的产品的典型处置方法包括报废、回收、返工或用良品替换,这种情形称为矫正检验(Rectifying Inspection)

现代质量保证系统通常较少强调可接受抽样,而是将统计过程控制和实验设计作为关注的重点。可接受抽样倾向于强化“满足规格要求”的视角而且不能给生产过程、工程设计和开发等这些质量改进的必要措施提供反馈意见。

质量管理统计方法在组织中应用的进化过程
下图描述了上述统计方法在组织中应用的进化过程:当企业的成熟度处于很低水平的时候,管理层可能完全意识不到质量管理的问题,在组织中很可能没有经过有效组织的质量改进举措,这时可能有一定的可接受抽样方法的应用,且应用领域通常是在来料检验中。当组织成熟度增长时,第一个活动是开始更多地使用可接受抽样的方法,而且这种方法的使用会逐渐增多,直至组织开始认识这样产品的质量并不能很好地得到检验和测试。

从这个时间开始,组织通常开始关注过程改进。统计过程控制和实验设计具有对生产活动、产品设计活动以及过程开发产生重要影响的潜在能力。系统性地导入这些方法通常是实质性质量改进、成本降低和产能提高的开始。当组织成熟度达到比较高的水平时,统计过程控制和实验设计就成为了企业非常常用的方法,而可接受抽样反而被相对较少地使用。

图:使用质量工程方法的各阶段图
PhaseOfQualityEngineering.png


质量工程(Quality Engineering)的目标是系统性地降低产品质量特性的波动。下图展示了这一过程是如何发生的。在早期,在可接受抽样还作为主要的方法被使用的阶段,过程“超差”和不满足规格要去的产品占了过程输出的较大比例。这时,统计过程控制方法的导入将是过程变得稳定并减少波动,使得过程满足要求。更进一步,过程波动的进一步减小会带来更好的产品效能、增强竞争优势。这时,在任何一个行业,我们都可以结合应用统计实验设计方法和统计过程控制方法来将过程的波动最小化。

图:质量工程方法的应用以及系统地降低过程的波动
ReduceVariability.png


注:本文由数据采集、统计过程控制SPC系统、分析自动化专家QuAInS 根据Douglas C. Montgomery相关专著翻译整理,转载请注明出处 收起阅读 »

基于统计的客户满意度计算公式

基于统计的客户满意度计算方法及原理 - 客户满意度是指组织在提供产品或服务时满足客户需求的程度。也就是说客户满意度=顾客之声/流程之声。客户之声,...
基于统计的客户满意度计算方法及原理
-
客户满意度是指组织在提供产品或服务时满足客户需求的程度。也就是说客户满意度=顾客之声/流程之声。客户之声,即客户需求,在统计上可以分成两个方面的意思:
一、组织提供的产品和服务服务是否满足了客户的极限需求(最低要求); 
二、产品和服务是否精确的满足了客户的理想需求(需求中心值); 
具体来讲,所谓极限需求,是指客户感知的服务不能超越的界限:上限和下限。比如客户定义一件衬衣不能超过1000元,不能低于600元;超过1000元意味着超出客户的感知的支付承受能力,低于600元,意味着失去这一品牌带给客户的社会定位价值。再比如手机充值到账时间不能高于30秒,不能低于0秒;超过30秒,会给客户带来很多不便,当然这个过程耗时越低越好,但也不可能低于0秒。很多情况下,尤其是大众化的产品,客户的极限需求是由组织代替定义的(这不是说组织决定客户的极限需求,因为虽然是由它开始由组织代替决定,但是在市场销售过程中,客户还是认可了这种极限需求),比如食品的保质期是3天,它意味着客户的极限需求是不能超过3天;如果超过3天可能让客户感知里面充斥了较多的添加剂,进而失去了产品的天然性。在这个类似保质期的客户需求中,组织通过自己的经验、技术为客户提供了客户认可的极限需求。但是如果这个食品在3天后依然没有腐坏,那么客户就有足够的理由认可里面添加了足够多的添加剂,从而会让原本忠诚的客户群体对此失去兴趣。相反的,如果客户接受了3天以后依旧没有腐坏的事实,并且继续购买产品,那么说明客户的极限需求并不是3天,而是更长的时候,比如6个月,甚至1年。当然当客户认可更长的极限需求的时候也意味着客户认可了添加剂的存在。 
当客户的极限需求范围较大(容差较大)的时候,组织容易获得较高的客户满意度。但是组织在为此庆幸的同时,一种潜在的威胁也就应运而生:客户可以选择的范围足够大,以至于组织的竞争者可以相对较容易的进入,从而伤害组织的利益最大化。比如目前市场上流通的各色手机,大众群体对其性能、价格等的要求范围非常宽泛,所以竞争比十年前就显得尤为激烈,甚至一些为大众市场提供较宽泛的客户极限需求的优秀组织,为此付出沉重代价,如Motorola和Nokia 等。而相反的,价格的极限需求和性能的极限需求非常窄的Apple,却获得了惊人的市场利润。目前市场上通过定义了狭窄的客户极限需求而获得成功的例子,举不胜举,大量的奢侈品牌就属于这个群体。他们不在同质和宽泛的价格上努力,而刻意选择较窄的客户极限需求区域,从而获得了高度的客户忠诚度。 
当客户的极限需求范围较小的时候,在为组织提供高度忠诚的客户群体的同时,也为组织可能带来一些致命性的伤害。客户的需求会随时间的推移慢慢变化,当这种变化积累到一定程度的时候,极有可能带来质的变化,如果此时组织不能做出敏捷的快速响应,后果将会极其严重。最明显的例子就是1920年代的福特汽车,当老福特把T型车的概念深入民心的同时,民众对汽车的需求也在不停的变化,所以当竞争者推出款式较多的汽车类型的时候,原本高度忠诚的福特客户群体终于开始抱怨T型车的单调,并逐渐选择其他品牌的汽车。这种不能对客户需求做出及时响应的策略,最终让福特汽车陷入困境,其绝对的垄断优势也荡然无存。除了客户的需求会发生缓慢的变化进而导致组织失去优势外,极限需求较小的市场,也容易被一些原本不属于这个市场、但是势力足够强大的嗅觉敏锐的组织蚕食。那些财大气粗的组织可以通过诱人的待遇挖走这个领域的人才,而人才的丢失将是导致这种市场的组织走向灭亡的最重要的因素;当然有时候某些组织有意识的选择性灭亡(被兼并),比如法拉利、保时捷等。 
这就产生了一种有意思的现象,一些特定的组织会在一个客户极限需求较窄的领域努力耕耘,但是它同时也在积极寻求那些财大气粗的组织的兼并或收购,进而获得较高的一次性利润,这种现象在互联网IT业表现的较为突出,比如2000年盛极一时的Chinaren被Sohu并购。注意:这种并购跟联想并购IBM、吉利并购沃尔沃不同,后者是因为准备并购组织发生了严重的财务问题。 
客户极限需求过宽或者过窄都会产生机会和风险,一般意义上,过窄的极限需求更容易促生优秀的组织。对一个锐意进取的组织,客户极限需求一般是没有所谓的恰好(折中)范围的,如果非要说有,那么它基本上是组织与客户相互妥协的结果。这种妥协会产生两种结果: 
1、组织与客户建立了战略性的合作协议,从而可以一同成长; 
2、损伤了组织与客户继续合作的基础,客户不想在下一个需求上继续这样的妥协甚至扯皮。 
能够通过妥协建立良好的客户关系的组织一般是提供对工业用产品的组织,因为它的客户并不是最终消费者,而是整个产品价值流的其中一个环节,而此时的客户也会被其的竞争者所侵扰,它亟需建立一个稳定的供应商联盟(这种组合在目前流行的供应链管理书籍上已经理论的很透彻,此处不再探讨)。 
但是当组织提供的产品和服务直接面向的客户是最终消费者的时候,任何与客户讨价还价的行为方式都会伤害客户的感情,从而失去市场份额。比如你不会愿意向曾经坑骗过你的商店购买手机。 
所谓理想需求,是指客户最乐意接受的需求,这种需求折射出了客户对组织的最佳远景。当组织能够提供客户理想需求的时候,一种高度的客户忠诚度就会建立起来。比如客户期望组织在11:00送货上门,那么如果快递员能在11:00准时敲门,就是满足了客户的理想需求。当然10:50敲门或者11:15敲门,客户可能也不会抱怨,但这样做总会给客户带来不便。而如果11:10是客户的极限需求的上限,那么11:15敲门可能面对的是客户的不满甚至客户已经走开了。举个切身的例子,本人经常出差各地为不同类型的组织培训管理知识,在去过的那么多酒店里面,有一家本人印象最深刻,因为每次刚步入大厅,前台就会立刻站起来说“啊,孟老师今天又来了?”,有时还会补充“今天套房有优惠”或者“我给您留了一间环境最好的大床房”。当听到这句话的时候,像我们出差在外的人就会顿感亲切的感觉,一种忠诚度就会莫名的建立起来。尽管这只是一家普通的商务型酒店,但很长一段时间内,每次到那个城市,我依旧愿意住在那里。 
问题在于,任何一种产品和服务,客户对其的要求都会包含众多方面,还比如上述的酒店,前台能够很亲切的叫出我的名字,毕竟只是我对其众多理想需求方面的一个,如果其他的方面不能满足客户的需求,那么即便它在某个方面做到了吻合客户理想需求,也不会建立足够的忠诚度。实际上,现在本人再去那个城市,已经不会入住那个酒店了,因为本人实在忍受不了它日益糟糕的硬件设施了。 
当客户对某一产品或服务提出需求的时候,具体到每一个客户个体,最终决定其满意度的不是极限需求是否被满足,而是理想需求是否被满足。如果理想需求没有被满足,那么即便极限需求被满足的再好,也基本不会起到较大的作用。自古代,尤其是像中国这样的古老国家,孝奉朝廷的各种陶瓷器就是属于为了满足宫廷理想需求而特别订制的,一旦这些定制的产品得到了宫廷的赞许,那么这些物件瞬间就变得价值连城,制作这些产品的作坊和技师也会因此而获得社会广泛的认可。在现代,某些优秀的组织,曾经尝试过针对每一个客户的定制产品,目的是为了满足客户的理想需求,比如戴尔公司的电脑定制,但多数类似的情形仅是其组织的一种广告策略而已,实际上并未真正做到100%的客户定制。 
在批量化生产和规模经济的当下,做到完整的产品定制以满足每个客户的理想需求已经变得不是那么容易,尽管每个组织都在呐喊“客户为中心”“客户是上帝”,但真正去实践的组织已经越来越少,更多的组织选择了利润为中心,这种做法的极致就是为了利润不择手段,甚至抛弃组织应有的社会责任。
当组织被质询满意度如何时,组织通常的做法是向特定的客户群体发放《满意度调查表》。在这个调查过程中,虚假的数据会掩盖组织真实的处境,而特定的被调查对象也会让组织变得夜郎自大(即便是那些锐意进取的组织也常常抱怨其收集到的满意度调查表除了粉饰太平外毫无用处)。因此一种全新的、合乎逻辑的、基于准确原始数据计算的客户满意度计算方法就显得尤其重要了。 
对于组织而言,其“潜在客户满意度”的计算方法是基于大量原始数据的,计算公式表述如下: 
(USL-LSL) /(UCL-LCL) * (Sigmacustomer / sigmaprocess)
●    组织提供的产品或服务均值与客户理想需求的均值一致 
●    USL、LSL是基于统计的大量客户的极限需求的上限和下限 
●    UCL、LCL是基于统计的组织提供给客户的需求的上限和下限 
●    Sigma customer是基于统计的大量客户理想需求的波动,即标准偏差客户 
●    Sigma process是基于统计的组织提供的每个需求的具体波动,即标准偏差组织 
●    满意度小于1很差,大于1.5合格,大于3优秀 
上述公式的提出,是计算客户满意度方面一个划时代意义的里程碑。通过这个计算公式,组织可以很容易的得到其真实的客户满意度水平,更重要的,原本虚无缥缈的概念,变得更加直观、数据化了。 
    标准偏差sigma的计算方法为: 
 
其中ei为不同客户的理想期望值或组织提供的实际值,e-bar为均值,n为收集到的数据的个数。
举例:某中式快餐店向客户声称,它向客户提供快餐的时间是2~6分钟,平均4分钟;而客户可以承受的快餐等待时间是3~5分钟,最好4分钟。过等待时间会让消费者产生抱怨,过短的等待时间会让客户感觉饭菜是早就批量做好的陈货,而且对后厨也是极具挑战性。在过去的一个星期,快餐店对100份快餐的上桌时间进行了数据收集。结果发现,上桌时间从2分钟到10分钟均有,平均值4分钟,sigmaprocess是1分钟;100位客人对上餐时间的要求从3分钟到5分钟都有,sigmacustomer是1分钟。 
则潜在客户满意度是 (5-3)/(10-2)  *  1/1=0.25<<1<1.5
因此从这个意义上看,客户对交付时间的潜在客户满意度是极其不满的。 
实例2: 某公司售后服务承诺接到客户投诉后8工作小时内给出答复,经调查,客户对投诉反馈时间的可承受期限是6至12工作小时以内(客户并没有奢望在更短的时间内解决问题,所以6小时被替代成极限需求下限),均值为9小时,标准偏差0.5小时。公司调查了过去50份客户投诉的反馈情况,结果发现,反馈时间从4小时到15小时都有,均值9小时,统计意义上标准偏差为2小时。 售后人员同时发放了传统意义上的客户满意度调查表,结果显示80%的客户对反馈及时率感到满意。 
则此公司的反馈及时率客户满意度为 
(12-8)/(16-6) *  (0.5/2) =0.1<<1<1.5 此过程潜在客户满意度严重不足。 
在这个案例中,尽管调查表的结果是80%回复满意,但这个数字是经过了多层筛选的结果: 
    那些很不满意的客户已经懒得回复信息; 
    人情世故使得评分者给出虚假的过高评价; 
    调查表的投放过程有潜意识的选择性; 
    非常不满和不满给企业的影响实质上远大于满意或者非常满意; 
潜在客户满意度描述的是组织提供的产品或服务的质量特性的均值与客户理想期望一致的情况下组织获得的潜在的客户满意度。但在实际交付过程中,组织提供的均值可以与客户的理想期望值并不一致,此时需要修订原本的计算公式,一种较简单的修订方式就是考虑实际交付的均值偏移客户理想期望值的程度。因此组织实际获取的客户满意度可以修正如下: 
(USL-LSL) /(UCL-LCL) * (Sigmacustomer / sigmaprocess) * (1-Δ/Expectedcustomer) 
其中expected 是客户的理想期望值,Δ是组织实际交付均值与期望值差的绝对值。 
组织可以用Customer Satisfaction Indicator 作为描述指标来描述真实客户满意度,简写Csi。因此
 
111.JPG


Csi在1.3以上表示客户满意度合格,2.7以上优秀; 
Csi在1以下表示客户满意度较差; 
实例3,依旧以前面的中式快餐店为例,它声称向客户提供快餐的时间是2~6分钟,平均4分钟;而客户可以承受的快餐等待时间是3~5分钟,最好4分钟。过等待时间会让消费者产生抱怨,过短的等待时间会让客户感觉饭菜是早就批量做好的陈货,而且对后厨也是极具挑战性。在过去的一个星期,快餐店对100份快餐的上桌时间进行了数据收集。结果发现,上桌时间从2分钟到10分钟均有,平均值5分钟,sigmaprocess是1分钟;100位客人对上餐时间的要求从3分钟到5分钟都有,sigmacustomer是1分钟。 
那么真实的客户满意度Csi= (5-3)/(10-2)  *  1/1 *(1-0.25)=0.19<<1<1.3
说明客户在交付时间上的真实满意度是很差的。  
如何提高客户满意度
提高客户满意度除了提供质量合格的产品或服务之外,售后过程的服务变得越来越重要,在某种程度上甚至超越了产品质量本身。笔者曾访谈过一位国内著名男装品牌的总裁,他曾经将过一个切身案例:他的公司需要购买自动化电脑裁床,L公司是国际领先的电脑裁床生产企业,但是在过去交往的数年中,他们感到L公司的服务令他们不能满意,因此后来在考虑购买新的裁床的时候,这位老总曾经反复思考过很多次要不要购买L公司的产品,最终,在忌惮L公司服务水准的情况毅然选择了另一家供应商。实际上很多公司的管理者曾有过类似的经历,在选择供应商的时候,售后服务是一项极为重要的衡量标准;因此如何提高客户满意度在很大程度上由售后的服务所决定。
售后服务又包含两大部分内容:1、产品基础的维护维修保障;2、让产品发挥最大效用的增值服务。目前多数家电等制造型企业的售后服务属于第一块内容,即快速的客户反馈,24小时甚至8小时的上门服务限时;实际上很多家电企业借此得到了快速的发展和市场占有率的提升;但是,当更多的供应商选择这种方法的情况下,仅靠快速的维护维修已经远远不能成为提高客户满意度的方法。以家电为例,现在几乎所有的企业都可以宣城他们可以在客户投诉的24小时内给出解决方案;既如此,提升客户满意度的方法必须有新的创举。于是当下,通过为客户提供更加全面的服务,让自身的产品或服务发挥最大的效用就成为获取更高客户满意度的不二法门。这种模式最早始于IBM等世界一流企业,早在20实际90年代初期,当多数PC商还在为如何提高PC性能和售后维修而努力的时候,IBM已经考试思考如何让客户能够用自身的PC实现更大的效用,于是IBM开发出了新的IT领域解决方案,由一家单纯的设备供应商发展为综合服务咨询提供商。而汽车领域的4S服务模式,则可以更简单更好的解释这一服务的优势:定期的维护保养计划、及时的信息传递,一体化/一站式的服务解决思路等等。
依据剑桥经济学院的最新研究表明,目前制造型企业有三个新的变革趋势,持续的服务是其中之一,并且进一步强调服务不再是单纯的维修,而是基于对客户的流程深入分析、并了解客户的流程和价值之后,如何将自身的产品发挥最大效用的咨询服务。剑桥经济同时强调,这一服务趋势将成为企业新的盈利增长点,是可以单独对市场销售的咨询服务:因为对于任何一家公司而言,它都掌握了比其客户更多的关于这一产品或服务的实际运行情况,它必定比客户更加了解自身的产品,并可以了解这一产品在行业的最佳实践;如果能将这些经验和知识传输给其客户,均可实现双赢的棋局。前面案例中讲到的L公司在奋起追赶服务满意度的时候,同样的也跳出了单纯的维修维护的概念,而选择了这样的能够为客户带来新的价值的服务思路,并且很快就获得了市场的好评。L公司认为在未来一段时间内,精益生产的理念将会普及到其客户的范围,于是它开始向市场推出基于电脑裁床的精益裁剪服务,它之所以限定在精益裁剪,而不没有涉及其他领域,恰是因为它明白自己的优势和客户购买其产品的真实意图:采用电脑裁床降低单间裁剪成本并提升裁剪质量,提高单位时间内产出;客户花数百万采购一台裁剪设备的目的绝不是为了少花几十万。
收起阅读 »

Minitab 17.2最新中文版的技术支持

Minitab官网最新中文版技术支持:#http#://support.minitab.com/zh-cn/minitab/17/ 附:打开时请删除#,然后复制...
Minitab官网最新中文版技术支持:#http#://support.minitab.com/zh-cn/minitab/17/
附:打开时请删除#,然后复制到浏览器中即可打开

6.JPG

使用控制图评估航班的整体运行状况

*2013年4月,第八届中国质量协会的颁奖典礼上,在评审“品质不折不扣”的理念下,我们公司以多年来致力追求满足客户满意度的决心与成就,脱颖而出,获...
*2013年4月,第八届中国质量协会的颁奖典礼上,在评审“品质不折不扣”的理念下,我们公司以多年来致力追求满足客户满意度的决心与成就,脱颖而出,获得中质协品质奖。
我们公司自1999年起,努力实践 6σ (Six Sigma)的提高客户满意度策略。 6 σ曾经协助许多世界级企业展现惊人的成绩,它曾经使通用电气(GE)公司迈向营运的高峰,被杰克韦尔奇称许为通用所采用的过最重要的管理措施;也是西方企业力抗日本企业反败为胜的法宝。*
在学习完六西格玛课程后,我们公司要求对航班准点率进行分析。于是,我们协调相关部门,收集了从16号到26号航班在各个航程上的延误时间,并对特殊的情况加以记录,比如大雾、下雨等异常天气影响。然后将数据按照日期、航程、原因、天分为四列,存储在Excel的工作表中,在这里,不难发现使用SPC中的控制图来监控航班运行状况比较合适。
接下来我们考虑使用专业的统计软件进行分析,那么使用什么工具来制作控制图呢?众所周知,在统计分析方面,比较专业的统计软件有Minitab、JMP等工具。下面,我们分别使用最常用的这两种工具进行控制图分析。
首先打开这两个软件,然后定位到软件中的控制图工具。
(1)在Minitab中,我们找到了两种制作控制图的工具,即统计菜单下的控制图选项以及协助菜单的控制图功能。按照通常的软件操作步骤,我们很快在菜单栏的统计和协助选项中找到控制图功能,路径非常清晰。

1.jpg



然后在JMP中,我也找到了两种制作控制图的方法,即控制图生成器和控制图菜单项,它们都位于分析菜单下的质量和过程菜单中。

2.jpg



(2)在进行分析之前,我们分别将这两种软件的控制图工具加以比较:
<1>直接的控制图工具
从图形上,我们很容易发现在Minitab的统计>>控制图的菜单选项中,根据控制图类型的不同,把控制图分为五类,选择起来非常方便。在控制图菜单的最上方,有一个正态转换的工具即Box-Cox转换,这使得我们在使用有正态性要求的控制图时,可以方便地确定最优参数,把非正态数据转换为正态。
同样,我们可以看到在JMP当中的控制图菜单上,是按名称进行排列的,所以在使用的时候,需要对控制图有充分的掌握,才能进行正确的选择。相对来说,Minitab的控制图使用起来比较简单。
<2>辅助的控制图工具
在这里,我打开了Minitab协助菜单中的控制图,根据图形提示,我们可以轻松、准确地选择工具,甚至可以直接使用协助菜单的控制图功能进行统计分析。
Minitab的协助菜单

3.jpg


使用协助菜单进行控制图分析

4.jpg



最后协助菜单还会对分析结果进行判定,大大简化了统计分析的工作。

通过协助菜单得到的分析结果

5.jpg


6.jpg


7.jpg


下面我们看一下JMP软件中的控制图生成器,在控制图生成器中我们可以灵活的进行输入,使用手动拖动来设置图形变量。
JMP中的控制图生成器界面

8.jpg


输入过程变量之后,得到以下结果

9.jpg


(3)接下来,我们分别使用两个软件中直接的控制图对航空数据进行分析,得到了下面的结果:
Minitab中的控制图输出

10.jpg


会话窗口输出

11.JPG


JMP中的控制图输出

12.jpg


我们看到,Minitab的输出结果更加详细,对于失控点有具体的解释的说明,而JMP在这里输出的信息相对较少。
当然,有时我们需要将分析结果导出来,这时我们可以在Minitab中右键选择导出到Word、PPT,或者直接添加到报表当中,或者选择复制、打印或者保存为独立文件(Minitab支持多种图形格式)。在JMP当中,我们可以使用菜单下的选择工具进行选择,然后复制或者导出所需结果。
在分析结束之后,我们需要对失控原因进行调查,以尽可能减少航班延迟时间,提高客户满意度。
从分析的工具选择上来说,Minitab当仁不让是实施六西格玛的首选软件,其简单的操作和强大的功能能够非常完美的匹配我们在项目实施中的各种统计分析需求,最重要的是能把结论接的给出,达到事半功倍的效果,不愧为“非统计专业的专业统计软件”。

收起阅读 »

Minitab 推出过程改善新的 Monte Carlo 仿真软件

云端的应用程序简化 Monte Carlo 仿真流程,并帮助工程师确定流程改进的最佳方案。 ...
云端的应用程序简化 Monte Carlo 仿真流程,并帮助工程师确定流程改进的最佳方案。

2015 年 2 月 3 日

Minitab 公司今天正式发布 Devize,一个针对工程师和设计师的新的基于云计算的蒙特卡罗仿真软件,以引
导他们 使用整个模拟和优化的过程。

通过使 用 Devize 工作流程,用户可以方便地模拟可能出现的情况,并提供带有明确注解的最终结果。引导用户使 用统计分析而无需任何猜测 --- 对后续步骤提出建议,对于为了改善流程和减少缺陷而有必要调整的
部分更 容易理解。

Devize 包括参数优化用以找到输入变量的最佳设置,敏感度分析用以帮助直观地了解输入变化所影响输出
的结果 ,分配识别为您提供的数据推荐最适合的分布,模拟比较全面评估结果并演示改进。

*“其他竞争对手也提供敏感度分析,但不具备 Devize 所特有的功能,”米歇尔•帕雷特,产品营销经理说,
“我们的敏感度分析不仅能显示出哪些因素的影响最大,而且使之量化,以帮助用户识别最好的改善途径。*

项目共享使用户能够毫无阻碍地与同事分享成果。基于云端的应用无需安装,其结果很容易从任何桌面或移动设备 进行访问。

我们的目标是为我们的客户提供易于的软件,”帕雷特说。 “Devize 是这一承诺的又一例证。”

有关 Devize 的更多信息,包括价格、许可证和免费试用版,可访问:minitab.com/devize

关于 Miinitab 公司

Minitab 公司是世界 领先的统计软件开发商之一。 4000 多所高校使用 Minitab 软件进行教学和研究。全球
成千上 万的公司使用的 Minitab 软件进行数据分析和质量改善项目。

Devize 是公司的最新产品,为工程师提供了强大的蒙地卡罗模拟工具。


公司的其他产品包括:

Minitab®17,用于质量改善和统计教育的软件。

Minitab Express,是专为教学和学习入门的数据统计,并适用于 Mac 和 PC。

Minitab® 的 QualityTrainer,在线学习课程,讲授质量改进数据统计,以及如何使用 Minitab 的统计软件。

Qeystone®,项目组合管理平台,来管理整个精益六西格玛组织部署。

Minitab®的 Quality Companion,执行质量改进项目的过程改善软件。



Minitab 同时提供优质的服务,包括培训和免费技术支持

Minitab 公司总部设在宾夕法尼亚州的州立大学,公司在英国、法国和澳大利亚设有办事处,拥有遍布世界
各地的地区代表。



更多信息请联系 Minitab 中国区总代上海泰珂玛信息技术有限公司 minitab@techmax.com.cn
收起阅读 »

自变量之间呈函数关系回归方程的难点(1)

多元回归分析中篇幅最多的是线性回归,因为一般情况,非线性回归模型可用多项式线性转换,用最小二乘法求解待定回归系数。但如自变量之间不独立,即有相关关系时一般回归分...
多元回归分析中篇幅最多的是线性回归,因为一般情况,非线性回归模型可用多项式线性转换,用最小二乘法求解待定回归系数。但如自变量之间不独立,即有相关关系时一般回归分析方法不合适。
比如二元回归方程,如考虑可能有二次幂变量,加上自变量之间也存在二次函数关系,有8个参数需待定。
最简单的二元一次回归方程,如自变量X和Z之间有函数关系的标准表达式应如下:
Y=a+f(Z)X+β2Z,(X是自变量,Z为解释变量。)此式原线性回归式中X的回归系数β1被Z的函数取代。f(Z)如是线性函数,展开化简后呈常见的X、Z和XZ三项变量。用f(Z)取代β1回归系数的表达式为了说明,XZ乘积项不能单从乘积符号上理解为《积事件》。在DOE中常有想从XZ交互作用中分离出X或Z的贡献,或“分散”交互作用的想法是徒劳的,自变量之间函数关系,比自变量与因变量响应呈非线性函数复杂得多。
Z变动影响因变量,同时Z变动引起X项系数的变动,间接影响因变量,即呈双重作用。β1如是常数,则是多元线性回归方程,可用最小二乘法求解。f(Z)如是线性函数,回归系数成为变量:当z变动时,X变量的斜率也会变动。在因子趋势图上会呈现X和Z的折线会相交,则有一级交互作用。此时直接用线性回归的最小二乘法不适,最好用偏最小二乘法求解。f(Z)如是非线性函数,传统偏最小二乘法也不适,需用《改进的非线性偏最小二乘法》。有文献观点:有时交互作用不显著,而线性回归又无法拟合,可能自变量之间呈非线性函数。
(参考文献:《多元回归中的交互作用》,《改进的高维非线性偏最小二乘回归模型及应用》) 收起阅读 »

自变量之间函数关系回归方程的难题(2)

自变量之间函数关系回归方程的难题(2) (1)建立多因子回归方程惯用方法是降元,剔除非显著性因子或非显著性交互作用。但由于自变量之间存在着交互影响,后面剔除了一...
自变量之间函数关系回归方程的难题(2)
(1)建立多因子回归方程惯用方法是降元,剔除非显著性因子或非显著性交互作用。但由于自变量之间存在着交互影响,后面剔除了一些自变量之后,前面剔除的自变量有可能从原来的不显著变为显著。(《观测数据的分析与处理》:P128)简言之:如自变量存多重相关性,逐步回归法也不适用。(王惠文《pLS回归在消除多重共线性中的作用》)
(2)但当P>2时,正态均值向量最小二乘估计的不可容性,即能够找到另一个估计,在某种意义上一致优于最小二乘估计。”(《应用回归分析》p14)即大于二元的回归方程,最小二乘法并非是最优计算工具。

收起阅读 »

假设检验为何要搞这么复杂呢,假设检验有谁知道分几种

是不是包括3中:均值,方差,标准差??
是不是包括3中:均值,方差,标准差??

六西格玛工具箱之方差分析与回归分析

方差分析(Analysis of Variance, 缩写为ANOVA)是数理统计学中常用的数据处理方法之一,是工农业生产和科学研究中分析试验数据的一种有效的工...
方差分析(Analysis of Variance, 缩写为ANOVA)是数理统计学中常用的数据处理方法之一,是工农业生产和科学研究中分析试验数据的一种有效的工具。也是开展试验设计、参数设计和容差设计的数学基础。
&nbsp;&nbsp;&nbsp; 一个复杂的事物,其中往往有许多因素互相制约又互相依存。方差分析的目的是通过数据分析找出对该事物有显著影响的因素,各因素之间的交互作用,以及显著影响因素的最佳水平等。
&nbsp;&nbsp;&nbsp; 方差分析是在可比较的数组中,把数据间的总的“变差”按各指定的变差来源进行分解的一种技术。对变差的度量,采用离差平方和。方差分析方法就是从总离差平方和分解出可追溯到指定来源的部分离差平方和。这是一个很重要的思想。
&nbsp;&nbsp;&nbsp; 回归分析(Regression Analysis)是研究一个变量Y与其它若干变量X之间相关关系的一种数学工具,它是在一组试验或观测数据的基础上,寻找被随机性掩盖了的变量之间的依存关系。粗略地讲,可以理解为用一种确定的函数关系去近似代替比较复杂的相关关系,这个函数称为回归函数,在实际问题中称为经验公式。回归分析所研究的主要问题就是如何利用变量X,Y的观察值(样本),对回归函数进行统计推断,包括对它进行估计及检验与它有关的假设等。 收起阅读 »