关于回归分析, ANOVA分析中“残差分析”的问题
方差分析有三个前提:
那么问题来了
- 在因子A的水平A1下,(A1-1,A1-2......A1-n)是来自正态分布N(μ,σ2)的一个样本
- 在不同水平下方差相等,即σ2=σ2.....=σ2
- 数据互相独立
那么问题来了
- 为何方差分析的前提必须是“在不同水平下方差相等”?如果实际情况下各个水平的方差确实不相等,那是不是就不能用方差分析和一系列涉及方差分析的内容(比如DOE 回归分析等等)呢? 遇到个实际情况,我公司是制药公司,要检测样品的含量,首先需要进行样品粉碎,现在研究四种样品粉碎的方式(简称:M1 M2 M3 M4),希望找到一个方式使含量结果X-bar尽可能大 且S尽可能小。通过分析数据发现M1-4之间确实存在方差差异,那理论上我是不是就不能使用one--way ANOVA分析呢(包括DOE,回归等等用到方差分析的模型都不能使用呢?)
- 为何在在方差分析时,我们是比较残差(真实值-拟合值)“是否成正态分布N” 和 绘制残差vs拟合y的散点图来查看“残差是否方差齐”,而不是直接查看“原始的响应值在同一水平下是否为正太分布”和“ 查看各个水平之间的数据是否方差相等”呢? 我的意思就是既然方差分析的前提是查看原始数据的正太,独立,齐方差,为何不直接分析原始数据而要分析残差呢?
- 问什么我上传问题在审核中已经3天了没没有显示,害得我又重新写一遍!脑阔疼!
没有找到相关结果
已邀请:
4 个回复
杨格_Alan (威望:668) (江苏 无锡) 机械制造
赞同来自: Jeff_Chou 、ZY518888 、lashasha 、格林凯特 、楠楠楠楠🌸 、yuaan更多 »
单因子方差分析,有至少三个基本假设:1. 水平内的数值符合正态分布;2. 各水平内的均值不论,但个方差在统计意义上相等(也就是只有实验误差的影响);3. 个数据的获得不带有依赖性,即要满足独立性;
这三条要求是Fisher开发ANOVA时给出的要求,这是因为:Fisher 爵士要分析已完成的试验结果;ANOVA使用的前提须满足前面的三个条件,才能进行;
Box 认为:单因子的方差分析很稳健,不一定要严格遵循正态性,其理由是小概率事件。
各样本之间的独立性,是诸如基于正态分布的统计推断的基石,这个大家应该好理解;方差齐性:意味着各水平之间的置信区间宽度一样(前提是各水平的样本数一样),这样的检验功效最大;
至于方差齐性检验结果为:不等。也不是没有各水平均值的检验方法,只要在Minitab-单因子方差分析-选项-不选择“等方差”项即可;
实验设计及回归分析中,也有方差分析,前提假设一样。但原假设是否成立,通过残差分析等等诊断可以看出来。
统计工具的使用,都是有前提的,如果这些前提不满足,那么残差分析和诊断就能判断出来。