您还没有绑定微信,更多功能请点击绑定

[它帖我跟]DOE多元回归中LOF的失拟问题

LOF失拟P<0.05,如果同时有以下不同情况分别代表哪些问题?
1.RSQ很低2.RSQ很高3.RSQ很高,但是残差有弯曲4.RSQ很高,但是残差无弯曲
解:我们来看下LOF和R-sq是如何产生的:Minitab假定了一个数学模式,然后根据已知数据计算出系数,这时出现了真实数学分布(这个是我们不知道的)和拟合数学分布.Minitab根据重复试验数据计算出pure error,再根据平均值(重复试验)及单值和拟合值之间的差异计算出LOF,其对应的P就是考量LOF和pure error关系的指标;因为R-sq只适用于线性回归,Minitab将各个高次项分别作为一次因子考量来将非线性转化为线性,这样就计算出了R-sq.我们再来看一个普遍性原理:人类由于懒惰,总期望通过很少的指标来描述一个复杂的分布,这样产生了统计量,但由于统计相长或相消等导致统计量不能很好的描述分布,这就是为什么%GRR/Cpk等衡量指标经常出错的原因。是故,越是复杂的分布,其描述性统计量就会越多;否则就会出错。但一个统计量可以说明一个数学模式模拟的不好;而说明一个数学模式模拟的很好却需要更多的统计量。我们再回到原题:前提LOF不好,说明LOF相对Pure error较大,存在这种情况很多:1.重复性好且数学模式模拟的也好(曲线通过平均值)=>R-sq很高(第2种情况);2.重复性不好但数学模式拟合较好(曲线偏离平均值)=>R-sq很高但残值有弯曲(第3种情况方差不等性);3.重复性好且数学模式拟合不佳重复性不好且数学模式拟合也不好=>没有很好的数学模式可以模拟(Minitab最高只能模拟出一元三次或多元二次,手动可以突破该极限)R-sq很差;4.重复性好且数学模式拟合很好(曲线通过平均值)=>说明方差齐性,但变异较大(第4种情况)综上:LOF不好,已经可以说明该数学模式不好接受了,无论R-sq如何;LOF主要是LOF和Pure error的比较,由于存在统计相长和相消,我一直在怀疑该指标的存在是否真的有价值另外,请大家记住一个真理:单次试验在统计上其重复性为零,但是相对真实值,其重复性可能很大。从这点也可看出统计存在骗人的地方。以上

2 个评论

游客无法查看评论和回复, 请先登录注册

发起人

csy_ysc
csy_ysc

Live not for myself, not for my lover,and not for my relatives. Just live for the future, which not belong to me, and not belong to anyone.

推荐文章

文章状态

  • 发布时间: 2007-11-25 18:34
  • 浏览: 2201
  • 评论: 2
  • 赞: 0