您还没有绑定微信,更多功能请点击绑定

Six Sigma - Improve Phase summary

http://bbs.6sq.net/thread-131959-1-1.html

第七章 Improve
7.1 试验设计基础
7.1.1 试验设计中的基本术语
1. 因子
a) 输出变量称为响应变量或指标。
b) 影响响应变量的那些变量称为试验问题中的因子。
c) 在试验中可以控制的因子,称为可控因子,controled factor。
d) 在试验中可以记录但是不可以控制的因子,称为非可控因子uncontroled factor,或噪声因子noise factor。
2. 水平及处理
a) 为了研究因子对响应的影响,因子的不同取值称为因子的水平level或设置setting。各因子皆选定了各自的水平后,其组合称为处理treatment。
3. 试验单元与环境
a) 指对象、材料或制品等载体,处理(即试验)应用其上的最小单位称为试验单元。
b) 已知或未知的方式影响试验结果的周围条件,称为试验环境。
4. 模型与误差
a) 误差error除了包含有非可控因子(噪声)所造成的“试验误差”experimental error外,还可能包含“失拟误差”,lack of fit。
b) 失拟误差指所采用的模型函数与真实函数间的差异。
c) 试验误差本身包含了测量误差,为了不影响测量结果分析,试验前进行MSA。
5. 主效应与交互效应
a) 因子A的主效应=A处于高水平时输出Y的平均值-A处于低水平时输出Y的平均值。
b) 如果因子A的效应依赖于因子B所处的水平时,称A与B之间有交互效应。
c) AB交互效应=BA交互效应=/2。
d) 如果两个因子间存在显著的交互作用时,不能只使用主效应来作为该因子是否重要的判断依据。某因子的主效应小,但书交互作用显著,则该因子就应该保留。
7.1.2 试验设计基本原则
1. 重复试验replication
a) 一个处理施于多个试验单元。这些单元是在统计推断中一个处理所形成的总体的代表,使得试验误差的大小可以被估计。
b) 将不同处理间形成的差别与随机误差相比较,当处理间这种差别比随机误差显著的大时,才说“处理间的差异是显著的”。
c) 要进行不同单元的重复replicate,而不能仅进行同单元的重复repetition。
2. 随机化randomization
a) 以完全随机的方式安排各次试验的顺序和/或试验单元。
b) 并没有减少误差本身,可以防止那些试验者未知的但可能会影响响应变量产生的某种系统的影响。
3. 划分区组blocking
a) 各试验单元间难免会有某些差异,如果能够按某种方式分组,每周内可以保证差异较小,则具有同质齐性homogeneous,可以在很大程度上消除由于较大试验误差所带来的分析上的不利影响。
b) 一组同质齐性的试验单元称为一个分组block。通过在一个区组内比较处理间的差异,就可以使区组效应在各处理效应的比较中得以消除,从而使对整个试验的分析更有效。
c) 能划分区组者则划分区组,不能划分区组则随机化。Block what you can and randomize what you cannot.
7.1.3 试验设计的必要性
全部因子全部水平的全部搭配都进行至少一次试验的安排方法称为全因子试验法。
7.1.4 试验设计的类型
1. 试验类型:
a) 因子个数:单因子、多因子;
b) 目的:因子设计、回归设计;
c) 不考虑区组:完全随机化设计complete randomized design;考虑区组:配对比较设计paired comparison design、随机区组设计randomized block design、平衡不完全区组设计balanced incomplete block design、部分平衡不完全区组设计partial balanced incomplete block design;
d) 因子效应:固定效应、随机效应;
e) 固定效应中,单向分类one-way layout、双向分类two-way layout、多项分类multi-way layout;
f) 随机效应中,主要是应用嵌套设计nested design或称方差分量模型variance component modeling。
2. 进行试验的两个目的――――因子设计与回归设计
a) 为了确定在相当多的自变量中,哪些X显著影响Y,称为因子筛选设计screening design,析因设计。
b) 为了确定X与Y之间的关系式,找出Y对于X的回归方程,针对回归关系的称为回归设计regression design。
c) 筛选因子的方法其实也是先建立一个Y与X间的简单线性回归方程,然后根据各项系数的显著性来选。
d) 试验设计中的“线性”,在回归方程中除了可以包含各自变量的一次项外,还允许包含两个或多个自变量的乘积项。
e) 筛选的要求较粗糙,试验次数少;建立回归曲面方程要求细致,试验次数多。
f) 实践证明:在因子设计中,使用两水平正交试验法再加若干中心点的设计方法最为简单有效。
g) 对于回归设计,也以建立二次回归方程为主要工具,比如响应曲面法。
3. 稳健参数设计
a) 目的是寻求系统的稳健性。即系统抗干扰的能力要强。
b) 尽量选择那些使得系统对噪声变化不敏感的控制因子的某种水平组合来达到目的,稳健参数设计,田口设计方法。
7.1.5 试验设计的策划与安排
1. 用部分实施的因子设计进行因子的筛选
2. 用全因子设计法对因子效应和交互作用进行全面分析
3. 用响应曲面法(RSM)确定回归关系并求出最优设置
7.1.6 试验设计的基本步骤
1. 计划阶段
2. 实施阶段
3. 分析阶段
7.2 单因子试验设计与分析
比较因子的不同设置间是否有显著性差异,选择哪些设置要好;
建立响应与自变量之间的回归关系,线性、二次或三次多项式,判断回归关系是否有意义。
7.2.1 单向分类设计
1. 应用方差分析法可以得到各水平间是否有显著性差异。
2. 究竟哪些组间有显著性差异?多重比较:Multiple comparison。
a) 参与比较的总体有k个,k>2,则比较两总体均值的t检验不能适用。
i. 零假设成立条件下,假定误判任意两总体均值不等的犯第一类错误概率为α0,需要两两比较的总体个数为s=k*(k-1)/2,最后总的犯第一类错误的概率为:αZ=1―(1―α0)s。
ii. 当k较大时,s也较大,αZ会变得非常大。
b) 保守方法,可以保证最后的不超过原来设定的α,只要取α0=α/s即可。
c) Tukey法,根据最后总的犯第一类错误的概率,再根据参加比较的总体的个数s,反过来计算出比较两总体时犯第一类错误的概率α0,再由此计算出任意两总体均值差的置信区间。根据此置信区间是否包含0做出判断。
7.2.2 多项式回归
1. 建立响应变量与因子间的回归关系。
2. 步骤:
a) 判断因子是否显著影响响应变量,ANOVA分析;
b) 拟合线性方程:Minitab->Stat->Regression->Fitted line plot,可以选择Linear或Quadratic进行拟合,然后进行残差诊断residual diagnostic;
c) 可以推广到更高阶情形。
3. 为了保持回归方程中各项独立性以便于检查各项效应的显著性,最好选用“正交多项式回归”Orthogonal polynominal regression。
4. 超拟合:一个取k水平的因子所获得的数据可以拟合k-1次的多项式,但4次以上的多项式是不使用的。次数更高使得估计和预测的方差变大,导致预测模型缺乏好的预测能力。称为“超拟合”overfitting。
5. 样条回归:如果低次多项式与数据拟合的确实不好的话,可以使用“样条回归”spline regression或分段样条回归。『参照数据分析中的样条函数』
7.3 全因子设计与分析
通常认为,加上了中心点之后的二水平试验设计在工程实践中已经足够了,在相当大程度上可以替代三水平的试验,并且分析简明易行。
7.3.1 二水平全因子试验概述
K个因子的二水平全因子试验记为:2k试验。整改全因子试验的记号,不仅仅是试验次数。
1. 试验目的
a) 一般来讲,先用部分实施的因子设计进行因子的筛选,让因子个数最后不超过5个;
b) 然后用全因子试验设计进行因子效应和交互作用的全面分析,进一步筛选因子直到因子个数不超过3个;
c) 最后用响应曲面发RSM确定回归关系并求出最有设置。
2. 试验的安排以及中心点的选取
主要研究如何在试验设计中考虑三个基本原则:重复试验、随机化和划分区组。
a) 每一个试验条件都重复2次或者更多次,这样对于试验误差估计得更准确了,但是增加了试验成本。另一种更巧妙的方法是只在“中心点”处安排重复试验,通常是在中心点处重复3~4次试验。
b) 如果因子全部是联系变量,中心点就是各因子皆取高水平与低水平的平均值。如果全部是离散变量,可以选取它们各种搭配中的某一个组合作为“伪中心点”。两种数据类型混合同理取“伪中心点”。不必要求试验的平衡,强调的是确实要有重复。
c) 选取“中心点”并在此处安排重复试验的好处,主要是为了进行完全相同条件下的重复,因而可以估计出试验误差(即随机误差)来。
d) 对于连续因子,增加中心点可增加对于响应变量可能存在的弯曲趋势估计的能力。
e) 在把因子点试验的顺序随机化之后,如果再把在中心点处所进行的3~4次试验安排在全部试验的开头、中间和结尾,则这几个中心点的试验结果间只应存在随机误差。试验结果的趋势可以帮助发现试验过程中出现的不正常状况。
3. 代码化及运算
a) 将该因子的低水平的代码取值为-1,高水平取值为1,中心水平取值为0。
b) 代码化后的回归方程中,自变量及交互作用的各项系数可以直接比较。系数绝对值大的效应要比绝对值小的更重要、显著。有量纲则无法比较,代码化后没有了量纲。
c) 代码化后的回归方程中内的各项系数的估计量是不相关的。删除或增加某项,对于其他项的回归系数将不会发生任何影响。比如保留x1x2项及删除此项时,x1的回归系数肯定要发生变化,使用不便,代码化后没有此问题。
d) 代码化后,回归方程中的常数项就有了具体的物理意义。全部试验结果的平均值,全部试验范围中心点上的预测值。
7.3.2 全因子设计的计划
a) 全因子设计的计划中,最关键的是选定因子及确定它们的水平。
b) 不能忘记随机化试验顺序。
7.3.3 全因子设计的分析
流程

I拟合选定模型
a) 看AVNOVA表中的总效果
H0:模型无效 ←→ HA:模型有效。
模型无效的常见原因
i. 试验误差太大:仔细分析误差产生的各项原因,设法降低,这是找到显著因子的关键措施。也可能要进行MSA。
ii. 试验设计中漏掉了重要因子:漏掉重要因子必然会使试验误差增大。宁滥勿缺。
iii. 模型本身有问题:模型有失拟或数据本身有较强的弯曲性。
b) 看AVNOVA表中的失拟现象
H0:无失拟 ←→ HA:有失拟。
失拟判定标准:
i. 最初是以重复试验间的差异作为试验误差的估计,将缺失的项(高次项、高阶交互项)所造成的误差平方和与之相比,F检验即可判明。
ii. 以后,将判明为不显著的各项都归并为随机误差项,重新计算失拟是否显著。
c) 看AVNOVA表中的弯曲项
H0:无弯曲 ←→ HA:有弯曲。
弯曲判定标准:
i. 最初是以重复试验间的差异作为试验误差的估计;
ii. 将高低水平的2个数据连同中心点的试验数据,构成自变量的3个不同的观测值,扣除线性项后可得二次项的平方和;
iii. 将二次项平方和与试验误差相比较,经过F检验判明是否呈现弯曲。
d) 拟合的总效果多元全相关系数R2(即R-sq)及修正的多元全相关系数R2adj(即R-sq(adj))。
SSTotal=SSModel+SSError
R2(即R-Square,R-sq)=SSModel/ SSTotal=1-SSError/ SSTotal,考虑SSModel在SSTotal中的比例。
i. 如果将自变量的可控的普通变量数据也看成随机变量,则可以求出二者间的相关系数。而R-sq恰好就是相关系数的平方。
ii. 对于多个自变量的情况,推广为“多元决定系数” ,R-sq的定义不变。
iii. R-sq的缺点:当自变量个数增加时,如只增加一个新自变量,不管增加的这个自变量效应是否显著,R-sq都会增加一些。因而在评价是否该增加此自变量进入回归方程时,使用R-sq就没有意义了。引入修正后的R-sq即R2adj。
iv. R2adj=1― / ,n为观测值的总个数,p为回归方程中的总项数(包括常数项)。
v. 扣除了回归方程中包含项数的影响的相关系数,可以更准确反映模型的好坏。越接近1越好。
vi. R2adj总比R2小一些。二者之差越小则说明模型越好。
vii. 如果将影响不显著的项删去后,二者更接近,则说明删去这些项确实使模型得到改进。
e) 对于s值或s2的分析
i. 观测值与理论值的误差服从N(0, σ2)分布。
ii. ANOVA表中,对应于残差误差中平均离差平方和(adjMS)的数值恰好是σ2的无偏估计量,记为均方误(mean square of error, MSE)。
iii. MSE平方根s可以认为是σ的估计。
iv. 粗略地讲,观测值基础上,加减2倍s,则可以得到预测值的95%置信区间。
v. s值越小说明模型越好。
f) 各项效应的显著性
i. Minitab的输出Estimated Regression Coefficitents for y中,列出各项的效应及检验结果。
ii. Pareto效应图(Pareto effect plot):将各效应的t检验所获得的t值作为纵坐标,按照绝对值大小排列,根据选定的显著性水平给出t值的临界值,绝对值超过的效应被选中。
iii. 正态效应图(normal effect plot):Pareto效应图的t检验需要用s2估计σ2,而通常s2并不一定可靠。将各因子的效应按照由小到大(正负号考虑在内)排列,标在正态概率图上,得到正态效应图(Normal effect plot)。
iv. 效应稀疏原则effect sparsity principle:大多数因子中只会有极少数因子效应是显著的。
v. 当我们挑选位于中间的一些效应的点群拟合一条直线后,就可以判定任何一个远离该直线的点所对应的效应是显著的。――――因为如果所有的效应无效,则这些点应该服从正态分布,点全部在直线;某些效应确实非零时,相应的估计效应绝对值应该会偏大,且一定会远离直线。
vi. 正效应,落在直线的右上方;负效应,落在直线的左下方。
II残差诊断
a) 主要目的是基于残差的状况来诊断模型是否合适。
b) 单纯从ANOVA表及回归系数的估计与检验系数两方面结果来分析整个结果是不完整的。【可以举出一些示例,ANOVA表及回归系数结果完全相同,但真实情况相差很远。】为了弥补第一步骤的不足,进行残差诊断。
c) 如果数据与模型的拟合是正常的,在残差应该正常。
d) 残差诊断四个观察:【参照6.1.3节残差分析描述】
i. 残差对于以观测值顺序为横轴的散点图:各点是否随机地在水平轴上下无规则地波动着;
ii. 残差对于以响应变量拟合预测值为横轴的散点图:残差是否保持着等方差性,即是否有“漏斗型”或“喇叭型”;
iii. 残差的正态性检验图:残差是否符合正态分布;
iv. 残差对于以各自变量为横轴的散点图:是否有弯曲趋势。
e) 残差不正常情况:【常见而被认为不正常】
i. 残差未保持等方差,“漏斗型”或“喇叭型”,说明对响应变量y作某种变换后才会与模型拟合更好。
ii. 残差虽然等方差,但是明显有U型或反U型弯曲:说明对自变量x仅仅取线性项是不够的,应增加x的平方项或立方项。
III判断模型是否要改进
a) 主要依据是基于数值计算及残差诊断的两方面结果。
i. 残差诊断可能提示:对y需要作某种变换,或要增加x的平方或立方项;etc。
ii. 基于各项效应及回归系数的显著性分析:删除不显著的因子,模型拟合要重新进行。
b) 凡是发现模型需要修改,就要返回到最初的第一步“I拟合选定模型”,重新建立模型,再重复前门各个步骤。
IV对选定模型进行分析解释
主要是在拟合选定模型后输出更多的图形和信息,并作出有意义的解释。主要三方面:
a) 输出各因子的主效应图、交互效应图;
b) 输出等高线图、响应曲面图等;
当自变量多于两个时,要分别对选定的某两个自变量作图。一般软件可以自动给出所有两个自变量的组合的等高线图、响应曲面图。
c) 实现最优化。
i. 按照具体问题的望大、望小或望目在数值上求出在整个试验范围内的最佳值。
ii. 使用软件的response optimizer。
V判断目标是否已经达到
将预计的最佳值与原试验目标相比。
a) 如果离目标尚远,考虑安排新一轮试验。通常是在本次试验得到的或预计的最佳点附近,重新选定试验的各因子及水平,继续因子设计或回归设计。
b) 如果已基本达到目标,则要作验证试验以确保将来按最佳条件生产能够获得预期效果。通常做法是先算出在最佳点的观测值的预测值及其变动范围,然后在最佳点做若干次验证试验(通常3次以上)。
i. 如果验证试验结果的平均值落入事先计算好的范围内,则说明一切正常,模型正确,预测结果可信。
ii. 否则就要进一步分析发生错误的原因,改进模型,再重新验证,以求得符合实际数据的统计模型。
c) Minitab输出说明:预测值fits,预测值处的标准差SEs of fits,预测值处的回归结果的置信区间(confidence limit, 95%CI),预测值处的单个观测值的置信区间(prediction limit, 95% PI)。
i. 95%CI表明回归方程上的点的置信区间。
1) 回归系数是以样本观测值为基础估计出来的,它必然会有误差。回归系数的误差必然会导致回归方程上预测值的误差。
2) 可以作为改进结果的预报写在总结报告中。
ii. 95%PI表明以上述回归方程上的点的置信区间为基础,加上观测值具有的方差为σ2的波动而给出的置信区间。
1) 假定波动的方差σ2为不依赖于自变量位置的常数,并已经求出其无偏估计MSE(mean square of error)。
2) 将来做一次验证试验时将要落入的范围,可供做验证试验使用。
d) 上述得到的是单个观测值的95%置信区间,如果要得到m个观测值的95%置信区间,使用公式:
i. n为试验总次数,p为最终模型中所包含的项数(常数项计算在内),m为验证试验的次数。
ii. 显然,当m=1时,此置信区间为95%PI;当m趋于无穷大时,此置信区间为95%CI。当要得到m个观测值的95%置信区间时,只要代入相应的m值即可。
7.3.4 全因子设计实例
略(p325)。
对“好”的回答一定要点个"赞",回答者需要你的鼓励!
已邀请:

powereyes (威望:2)

赞同来自:

有没有全文可看?

6 个回复,游客无法查看回复,更多功能请登录注册

发起人

扫一扫微信订阅<6SQ每周精选>