您还没有绑定微信,更多功能请点击绑定

CPK和PPK区别(老生常谈)

一、定義和概念描述


Cp: capability process
Cpk: capability process index
Pp: preliminary process
Ppk: preliminary process index
Cmk: capability machine index


Cp指数=规格宽度/工序宽度=(USL-LSL)/6 sigma

Capability of process 过程能力指数
Cp:我们能做的多好

Cpk:我们真正能做多好
Pp:过程性能指数

Pp:我们实际作到多好

Ppk:修正的过程性能指数,Ppk:我们实际真正作到多好


二、實際選用CPKPPK的技巧

Cpk或Ppk:你应该用哪一个?

你们的客户会要求你们汇报你送出产品的Cpk值,要算出Cpk值,你必须要有产品规格,平均值及标准差(σ值),当你把这些收集后,有人就会问”需要哪个σ值呢?”

Cpk是通过规格除3个标准差所计算出来的值,但使用哪一个σ值,估计值还是计算出来的呢?哪一个是正确的?向客户汇报哪个值呢?一般我们大多数人使用Cpk看来比较好的那个值.但是,这个看来比较好的值可能并没有精确的反映你们客户所需要知道的制程.

两种不同的方法计算Cpk值产生混乱的一个原因就是新发展了Ppk值,Ppk使用各个个体数据与均值的离差的σ计算值)各单独个体离差的σ。

假设Ppk使用σ计算值,就不需要在Cpk中使用全部个体数据的σ计算值了,对于Cpk唯一的公式就是使用σ估计值(以短时间小样本为一组的极差,各组极差的平均值为估算 σ:

在1991年,ASQC/AIAG Task Force出版了”基本数据(统计)制程控制”参考手册,上面谈到Cpk以及Ppk的计算公式,这些应该可用来消除计算Cpk值时的混乱了,因此,汇报哪个值呢,是Cpk还是Ppk?尽管它们显示类似的信息,但在用途上还是有些区别的σ估计值和相关的数值(Cp Cpk和Cr)是用来测量一个体系满足顾客要求的潜在能力,当你想分析一个体系的发展倾向时可以用σ估计值.实际值或σ计算值(个别值的标准差σ)以及相关的数值(pp ,Ppk以及Pr)是用来测量满足顾客要求的能力,当你想测量一个体系的实际制程性能时可以用上此值.也就是6sigma理论中,cpk代表短期工序能力(某一小段时间内的工序能力,连续的数据)ppk代表长期工序能力(一个长时间,如一年或都说所有的,全部的,可以是间断的数据)。他们的计算公式是相同的,唯一的不同是标准偏差σ的计算方法不同。
三、CPKPPKσ計算差異**

**
ppk的标准偏差σ(长期)=stdev()(也就是常规算法,stdev是excel中算标准偏差的公式)﹔
cpk的标准偏差σ(短期)=R平均值/d2 (R-bar算法) 或 σ(短期)=S平均值/c4(S-bar算法), d2,c4是修偏系数他们与分组n有关,可查表(计算短期的标准偏差需要分组n最小=2, 计算长期标准偏差时,将长期收集的所有数据看成为一个样本)。当数据越接近正态分布时ppk与cpk的的差别越小,也就是短期对长期越有代表性。

这就是cpk与ppk的不同,
但是我们又发现一个问题。ppk标准偏差的计算和我们通常计算的cpk的计算方法一样,为什么呢?因为平时我们计算的工序能力cpk时,要求在工序稳定的状态下连续取样,也就说我们默认我们的取样是代表整个工序的长期的工序能力,所以我们传统意义中的cpk就是6sigma中的ppk. cmk也就是设备能力指数.计算与PPK,CPK相似,但在研究机器能力时,必须保证除机器外的其它因素稳定的条件下连续取样。
在点子随机排列的情况下,下例判稳准则正确的是:
A-连续20个点均在界内 B-连续35个点中有一点出界
C-连续100点中有3点出界 D-连续30个点中有一点出界
教材里没有,请指教!
1、连续25点界外点数不超过0
2、连续35点界外点数不超过1点
3、连续100点界外点数不超过2点
怎样抽取样本?——抽取样本的方法

抽样检验是根据部分实际检验结果来推断总体标志总量的一种统计检验方法,属于非全面检验的范畴。它是按照科学的原理和计算,从若干单位组成的事物总体中,抽取部分样本单位来进行检验、观察,用所得到的检验标志的资料以代表总体,推断总体。
  与其它检验一样,抽样检验也会遇到检验的误差和偏误问题。通常抽样检验的误差有两种:一种是工作误差(也称登记误差或检验误差),一种是代表性误差(也称抽样误差)。但是,抽样检验可以通过抽样设计,通过计算并采用一系列科学的方法,把代表性误差控制在允许的范围之内;另外,由于检验单位少,代表性强,所需检验人员少,工作误差比全面检验要小。特别是在总体包括的检验单位较多的情况下,抽样检验结果的准确性一般高于全面检验。因此,抽样检验的结果是非常可靠的。
  抽样检验资料之所以能用来代表和推算总体,主要是因为抽样检验本身具有其它非全面检验所不具备的特点,主要是:
  (1)检验样本是按随机的原则抽取的,在总体中每一个单位被抽取的机会是均等的,因此,能够保证被抽中的单位在总体中的均匀分布,不致出现倾向性误差,代表性强。
  (2)是以抽取的全部样本单位作为一个“代表团”,用整个“代表团”来代表总体。而不是用随意挑选的个别单位代表总体。
  (3)所抽选的检验样本数量,是根据检验误差的要求,经过科学的计算确定的,在检验样本的数量上有可靠的保证。
  (4)抽样检验的误差,是在检验前就可以根据检验样本数量和总体中各单位之间的差异程度进行计算,并控制在允许范围以内,检验结果的准确程度较高。
基于以上特点,抽样检验被公认为是非全面检验方法中用来推算和代表总体的最完善、最有科学根据的检验方法。
1.抽样的一般程序
“确定抽样总体→确定样本数→确定取样范围→抽取样本→评估样本的代表性”,这是抽样的一般程序。
首先,根据本次评估的目的和任务,明确所要测量属性的范围,确定取样的对象,即抽样总体。
第二,在抽样总体内收集界定其全部个案,并予以编号,形成抽样框架,明确总体内抽样的范围。
第三,根据抽样框架内个案的差异程度及其本次评估所要求的测量精确水平,确定合算的最佳样本数。
第四,采用科学的抽样方法及其组合,从总体中抽取样本,确定测量的对象。
第五,运用计算法、比较法等方式对抽取样本的代表性进行评估,尽量减少抽样误差。

2.抽样方式
抽样的基本方式。抽样的基本方式分为两大类:随机抽样和非随机抽样。
若总体中每个个体被抽取的机会是均等的,则称为随机抽样,随机抽样必须遵循一个原则,一是总体中的每个单位都有同等的被抽中的机会。抽取应当是完全客观的,不能依据某个人的主观意志加以选择。二是所选择的人或单位彼此之间没有牵连,每个人或单位的选择都是独立的。
非随机抽样是根据主客观条件而主观选择样本的方式,又称判断抽样。这种方式虽然有省人、省时、省物、易实施的优点,但科学性较差,不能保证样本的代表性,故在教学评估中很少应用。
什么时候用概率抽样,什么时候用非概率抽样,应当根据各种条件来决定,例如研究的性质、对误差容忍的程度、抽样误差与非抽样误差的相对大小、总体中的变差、以及统计上的操作上的考虑等。尽管非概率抽样不能推断总体,不能计算抽样误差,但在实际检验中仍常被应用。一方面是操作的考虑,减少非抽样误差的发生,另一方面也是因为所检验内容不需投射总体,而且一般总体的同构型较强。如概念测试、包装测试、名称测试以及广告测试等,这类研究中,主要的兴趣集中在样本给出各种不同应答的比例。概率抽样用于需要对总体给出很准确的估计的情况,例如要估计市场占有率、整个市场的销售量、估计某个地区的电视收视率等。还有全国性的市场跟踪研究(提供有关产品分类和品牌使用率等信息的研究),以及用户的心理特征和人口分布的研究等,都采取概率抽样。但在概率抽样时要特别注意控制检验过程中的非抽样误差。
1>、概率抽样
概率抽样包括简单随机抽样,分层抽样,等距抽样,整群抽样等,每个样本的中选概率是已知的,因此可以计算抽样误差。通常的实地检验中,是把这几种抽样方法相互结合。
简单随机抽样
简单随机抽样,也叫纯随机抽样。就是从总体中不加任何分组、划类、排队等,完全随机地抽取检验单位。特点是:每个样本单位被抽中的概率相等,样本的每个单位完全独立,彼此间无一定的关联性和排斥性。简单随机抽样是其它各种抽样形式的基础。通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。
抽样的随机性原则可通过抽鉴法,随机数码表法或摇号机摇号法来保证。抽签法是指先将评估总体中的每一个个体都编上号码,再将每个号码写在标签上,将标签充分混合后,从中抽取几个签,与号码相应的个体的集体就成为样本。随机数码表法是借助随机数码表随机抽取样本的方法。
抽样的独立性和保证,对于有限的评估总体要用放回抽样方法,对于无限总体则不要求放回。在教育评估的测量抽样中,放回抽样往往不可能,因此在应用时即使是有限总体,若总体中的个体数较多,而且总体内的个体数是样本容易数的10—20倍时,也可视为无限总体,实行不放回抽样。
单纯随机抽样中样本容量的确定因测定目标和总体的有限性而不同。
等距抽样(机械抽样或系统抽样)
机械抽样(等距抽样)。把总体中的所有个体按照一定的标志排列编号,然后以固定的顺序和间隔取样的方法,称为机械抽样。将评估对象总体单位N按照一定的标志进行排队编号,并将N划分成相等的几个单位,使K=N/n,然后随机抽取i,i+K,i+2K,……,i+(n-1)K共n个个体组成样本。
机械抽样比单纯随机抽样能够保证抽到的个体在总体中的分布比较均匀,抽样的独立性较强;单纯随机抽样比机械抽样能够保证总体中个体被抽到的机会均等,即抽样的随机性较强;单纯随机抽样和机械抽样二者也可以结合使用。机械抽样中样本容量的确定可按单纯随机抽样的公式进行计算。
机械抽样方法一般不适用于大容量的评估总体;当评估总体的个体类别间悬殊时,机械抽样抽取的样本常常缺乏代表性;机械抽样的间隔接近评估总体中个体类别分布的间隔时,常常形成周期性的偏差。这些都是教学评估测量中应用机械抽样需要注意的基本方面。
特点是:抽出的单位在总体中是均匀分布的,且抽取的样本可少于纯随机抽样。等距抽样既可以用同检验项目相关的标志排队,也可以用同检验项目无关的标志排队。等距抽样是实际工作中应用较多的方法,目前我国城乡居民收支等检验,都是采用这种方式。
分层抽样
分层抽样。按与评估内容有关的因素指针等标志先将评估总体加以分组(分层),然后根据样本容量与总体的比率,从各层中进行单纯随机抽样或机械抽样的抽样方法,称为分层抽样。例如,对评估对象为N的总体中,拟取n个个体为样本,可根据一定的标准将N个个体分成优(N1个)、良(N2个)、中(N3个)、差(N4个)四层,然后从各部分(层)中用单纯随机抽样或机械抽样的方法,各抽取n/N,即从优,良,中,差等中分别抽取Ni=n/N(i=1,2,3,4)个个体,组成一个评估测量样本。
运用分层抽样抽取评估的测量样本时,要尽力缩小各层组内的差异,增大层组间的差异;同时层组的划分也不宜过细,以免层组内个体数目过少而无法抽样;再次划分层次的标准必须明确,以免混淆或遗露。
特点是:由于通过划类分层,增大了各类型中单位间的共同性,容易抽出具有代表性的检验样本。该方法适用于总体情况复杂,各单位之间差异较大,单位较多的情况。
整群抽样
整群抽样就是从总体中成群成组地抽取检验单位,而不是一个一个地抽取检验样本。分层抽样划组层为类,其作用是尽量缩小总体,使总体的变异减少,而抽取的基本单位仍然是总体中的个体。整群抽样是将评估对象总体的各个个体划分成若干群。然后以群为单位从中随机抽取一些群而组成样本的方法,从中抽取若干个群,对抽中的群内的所有单元都进行检验。即整群抽样划组层为群,群的作用是扩大单位,抽取的单位不再是总体单位而是群。例如要测量某市某年级数学高考成绩,可以以学校为单位进行抽样。
整群抽样的主要缺点是样本分布的匀均性较差,误差也较其它抽样方法大。为了弥补这种缺陷,增强样本对总体的代表性,可以与分层抽样相结合,例如,先按一定的标准把全地区所有学校分成几部分,然后再根据本容量与总体中个体的比率,从各部分中抽取若干学校,组成整群样本。
特点是:检验单位比较集中,检验工作的组织和进行比较方便。但检验单位在总体中的分布不均匀,准确性要差些。因此,在群间差异性不大或者不适宜单个地抽选检验样本的情况下,可采用这种方式。
阶段抽样。当评估所要测量的总体很大时,在实践中常采用阶段抽样。首先将评估总体分为A组,每组包含Bi个单位。从A组中随机抽取a组,再分别从抽中的a组的各组中随机抽取ni个单位,构成一个样本,这种抽样方法就是阶段抽样中的两阶段抽样,其中总体单位数N=B1+B2+B…+BA,各组的单位数Bi可以相等,也可以不相等;样本单位数n=n1+n2+…+na,各组抽取的样本单位数可以相等,也可以不等。多阶段抽样的原理与两阶段抽样的原理相同。在阶段抽样中,由于每一阶段的抽样都会产生误差,所以阶段越多,误差越大,经多阶段抽取的样本的代表性越差。因此运用阶段抽样时,要特别谨慎,尽量提高各阶段抽样的精确度,严格控制整群、分层、机构、单纯随机抽样的误差限度。防止误差传递造成阶段抽样的失败。
目的抽样。目的抽样是根据特定的目的,有针对性的随机抽取样本。虽然从广义上说,目的抽样也是随机抽样的一部分,但它与一般的随机抽样却有所不同。它强调抽样的针对性与目的性,而不是泛泛地任意抽取样本。这种抽样方法在实行时,先是要根据一定的抽样目的与需要,挑选出符合抽样目的与需要的对象,然后再在这些已挑选出的对象中进行抽样。如检验一个学校优秀教师的情况,事先要先把那些符合优秀教师条件的人挑选出来,然后再从这些人中抽样。目的抽样由于是在一定的符合抽样目的的范围内进行,所以用目的抽样法抽出来的样本都具有一定的代表性,可以免去其它随机抽样的任意性与偶然性因素,便于集中精力,取得检验的实际效益。因此,目的抽样就成为抽样法搜集教学评估资料信息的一种行之有效的重要办法。
2>、非概率抽样
非概率抽样是不能计算抽样误差的,因为它是靠调研者个人的判断来进行的抽样。它包括偶遇抽样或者方便抽样、判断抽样、配额抽样、雪球抽样等。
偶遇抽样(方便抽样)
常见的未经许可的街头随访或拦截式访问、邮寄式检验、杂志内问卷检验等都属于偶遇抽样的方式。偶遇抽样是所有抽样技术中花费最小的(包括经费和时间)。抽样单元是可以接近的、容易测量的、并且是合作的。但尽管有许多优点,这种形式的抽样还是有严重的局限性。许多可能的选择偏差都会存在,如被检验者的自我选择、抽样的主观性偏差等。这种抽样不能代表总体和推断总体。因此,当我们在进行街头访问或邮寄检验时,一定要谨慎对待检验结果。
判断抽样
判断抽样是基于调研者对总体的了解和经验,从总体中抽选"有代表性的""典型的"单位作为样本,例如从全体企业中抽选若干先进的、居中的、落后的企业作为样本,来考察全体企业的经营状况。如果判断准,这种方法有可能取得具有较好代表性的样本,但这种方法受主观因素影响较大。
配额抽样
配额抽样是根据总体的结构特征来给检验员分派定额,以取得一个与总体结构特征大体相似的样本,例如根据人口的性别、年龄构成来给检验员规定不同性别、年龄的检验人数。配额保证了在这些特征上样本的组成与总体的组成是一致的。一旦配额分配好了,选择样本元素的自由度就很大了。唯一的要求就是所选的元素要适合所控制的特性。这种抽样方法的目的是使样本对总体具有更好的代表性,但仍不一定能保证样本就是有代表性的。如果与问题相关联的某个特征未被考虑进配额,配额样本可能就不具有代表性,但在实施中包括太多的控制特征是十分困难的。另外,用这种方法进行选择时,往往存在检验员的选择偏好,因而也难以避免主观因素的影响。如果在严格控制检验员和检验过程的条件下,可使配额抽样获得与某些概率抽样非常接近的结果。在进行配额抽样时,要特别注意配额与检验结果之间的密切联系。
雪球抽样
雪球抽样是先选择一组检验对象,通常是随机地选取的。访问这些检验对象之后,再请他们提供另外一些属于所研究的目标总体的检验对象,根据所提供的线索,选择此后的检验对象。这一过程会继续下去,形成一种滚雪球的效果。此抽样的主要目的是估计在总体中十分稀有的人物特征。由于后来被推荐的人可能类似于推荐他们的那些人,因此这种方式的检验也是非概率的
3.随机原则
在商业性的市场检验中,普查这种全面检验的方法几乎是不可能使用的,大多数商业检验都采用抽样方法获得样本。抽样是统计数据质量的灵魂,样本抽选的好坏,直接关系到最终检验结果是否能反映总体的真实情况。
  在抽样检验中,随机原则是至关重要的。在检验工作中,我们事先并不知道总体的分布具有什么特征,这样在抽选样本的时候,如果不能坚持随机原则,可能会给检验结果带来偏差。例如,有些厂商选择在计算机市场检验计算机用户的情况,而实际上经常去计算机市场的人与不经常去的人,是存在较大差异的,以经常在市场中活动的发烧友的行为去推断普通用户的行为,必然会导致一定的资料偏差。
抽样检验的原则和方法抽样检验设计和实施要遵循两个基本原则,抽样必须随机化和样本大小适当。随机化需要一定的技术程序以同等概率来实现,“随机”不等于随意或随便。从口袋里摸取有号码的纸团,结果不会得到满意的随机样本。抽签法或掷钱法在原则上虽是可取的,但实用的价值很小。
Q(X)-Q(S)控制图的理论基础与作图 
------Awencg
 
  SPC技术是当今最流行的一种质量控制和改进方法,它主要运用各种类型的控制图对过程进行监控,X-R,X-S控制图由于具有适用范围广、检出异常的能力强等特点被广泛使用于质量特性值是计量型数据的过程控制.使用这两类控制图,若过程参数未知,则进行在线控制之前要求获取不少于25样本、每个样本的样本大小为4或5的测量数据(观测样品),这表明在小批量生产和大批量过程(生产)的开始状态下,要进行实时控制,使用X-R,X-S控制图在技术上存在困难.因为即使批量很大,由于要获得理想的均值和标准偏差的估计值必须收集大量的数据,控制图控制线在确定之前,已经生产了许多产品.鹊森伯里(Chares P . Quesenberry)在九十年代提出Q控制图,用以解决小批量生产以及大批量、过程刚开始时的过程控制.Q(X)-Q(S)控制图用于控制计量型数据过程的均值和样本方差,包括Q(X)一样本序号i图和Q(S)样本序号i图.

.Q(X)-Q(S)控制图的理论依据是基于两个总体的均值和两总体方差的显着性检验,将前i-1个样本和第i个样本看作为两个总体.因这两个总体实际上是来自于同一个整体的,故此可知总体的均值和方差是相等的.但具体数值为多少是未知数,这些条件是符合两个总体均值显着性的检验,和两个总体方差显着性的检验.这样检验前i-1个样本的统计量和第i个样本统计量的显着性,如果它们有显着性就说明第i个样本已发生了显着的差异,从而判断工序的稳定以否.

当检验总体的均值统计量时,检验前i-1个样本的均值与第i个样本的均值是否有显着性差异,如差异显着性,说明第i个样本的均值已发生了变化 ,即统计量

,其中:

当检验总体的方差统计量时,检验i-1个样本的平均方差和第i个样本的方差是否有显着性差异,如差异显着,说明第i个样本的方差已发生变化 ,统计量
据以上两总体均值和两总体方差检验的统计量(t,F)与Q控制图两统计量 (Wi,Yi)的比较,两者是一致的.

Q(X)-Q(S)控制图的统计量看起来虽然很复杂,用手工完成难以想象,但用电子表格Microsoft Excel可以轻易实现,方法如下:

1> 建立表格式样,并以Q(Xi)和Q(Si)两行作为数据来源插入图表:


2> 在相应的单元格内输入公式(注意公式前一定要加等号”=”):


3> 在样本栏项输入数据:

为使图形显示空间足够大,将一些不必需的行隐藏(设行高为0),同时为防范误改公式,需要将相关的公式单元格保护:选定要保护的单元格→格式→单元格→保护→锁定(需输入资料的单元格不能选锁定)→确定→再选工具菜单→保护→保护工作表→选定:内容/对象/方案→输入密码(亦可不输入)→确定.即可完成!


附一,公式的验证方法:

将<<Q控制图>>中表1例1 Q控制图计算数据中的样本均值的数据按顺序输入表格Xi行各单元格; 将样本方差的数据按顺序输入表格Vi行各单元格.比对Q(Xi)和Q(Si)应与表格中的Q(Xi)和Q(Si)一致.
对“好”的回答一定要点个"赞",回答者需要你的鼓励!
已邀请:

wyh1981324 (威望:0) (上海 浦东) 其它行业 员工 - 30年前还有坚持,我希望属于我;30年后还有感动...

赞同来自: tan_ping

6Sigma和SPC手冊中,CPK都是指: Capability process index
"Process Capability index ('equivalent') taking account of off-centredness: effectively the Cp for a centered process producing a similar level of defects - the ratio between permissible deviation, measured from the mean value to the nearest specific limit of acceptability, and the actual one-sided 3 x sigma spread of the process. As a formula, Cpk = either (USL-Mean)/(3 x sigma) or (Mean-LSL)/(3 x sigma) whichever is the smaller."
至於為何CPK叫CPK而不叫CPI, K表示的是偏移度,K=绝对值(M-μ)/0.5T,它只是一个字母而已,就象Y=KX+b中的字母Y,K,X,b一样的含义.

13 个回复,游客无法查看回复,更多功能请登录注册