《正交法与应用数学》读后感(七)
对于极差法的补充解释。
以张里千为首北大推荐的简单易懂的正交优化法,过去简称极差法。
但张里千著作有些学者说看不懂,本质是和传统参数统计学相悖,所以用其它文献解释其合理性有必要。
(一) 部分正交试验是非参数统计概念。
A:部分正交表设计非随机性。
B:数据太少(哪怕重复8次)难证实是正态分布。而方差分析需正态分布为前提。
(二) 极差法推荐第一轮用小表,而且不重复。
A:《实验统计学》(美:玛.吉.纳特雷拉)P231:
“对于部分析因试验,显然没有重复实验的必要…”
B:不重复的可信度。偶然性背后是必性,重复8次也是小样本。
所以关键水平距离要尽可能拉开,凸现差异性。
(三) 正交表不排交互项:
A:正交表目的寻找最优水平的参数组合,而交互项无直接可调的水平,所以是不可控的。要量化出交互项是为建回归方程。
而极差法不一定要建数学模型,如同0.618黄金分割法,结合分析点线图(趋势图)用2到3轮小表逐步逼出最优水平组合。最后用重复试验验证。
B:主效应、交互作用量化精度。
《多元回归中的交互作用》p35:“在乘积模型中,X和Z的回归系数并非如传统认为的那样代表主效应,相反,这些系数代表的是简单效应。”在有交互作用时,是表的列效应,非主效应。
C:对于不重复试验的疑虑:同上p9:
“单自由度的交互比较是交互分析的核心。它们代表了交互作用的关键检验。”
D:《实验统计学》p239:
“部分析因实验不可能得到全析因设计那样多信息。这种方法所达到的经济性是以因素间的某些交互作用可忽略这个假定为前提的。”(简言之,部分正交试验无法精确量化出交互作用。)
E:不排交互项,可多排因子(其次最好3水平),不少试验失败是漏掉可控因子。
某文献三因子案例,用L8的2水平设计,列入交互项,重复3次,花不少功夫计算交互作用。如用不重复L9排3水平,非线性响应因子、交互作用、最佳组合水平方向一目了然。
(四) 极差法和建模法对比。
A:极差估计因子效应的重要性排序,基本和方差分析一致。
B:三水平点线图,可直观看出非线性响应因子、交互作用及强弱。因子折线非直线是可控因子和响应有非线性关系,是稳健性设计的基础。两线相交有交互作用,夹角大则交互作用大,平行无交互作用。
B:两因子回归方程,最复杂的可能有8个变量,完全析因设计可量化出所有变量。
而现时正交试验都是部分试验,比如回归方程要忽略不显著因子或不显著交互作用。
但不显著不等于没有作用!比如响应曲面,如无交互作用是超平面,而忽略不显著交互作用会影响其凸凹度。
算出的回归方程在实验验证时,常出现不符。但人们用实验误差等理由解释,但回归方程近似性无法回避。
(五)一个重复试验大正交表试验作出的回归方程可信度。
某文献二因子三水平非线性案例,试验用EXCEL做出回归方程,预测最佳水平组合均在第二水平和第三水平之间。
但在点线图上呈现在二、三水之间二个因子折线平行,而一、二水平间折线小角度相交,呈现弱交互作用,最佳组合可能在一、二水平区域,所以可质疑原推断最佳组合的合理性。
用极差法思路:由于两个因子折线均是曲线,二水平处是最大值。所以可用L9表一次三水平试验可解决四因子初选,用非术语即“广撒网”。第二次正交试验设计水平以原二水平为中值水平,上下水平设计为小间隔:即“加密网”。最后共可得出5水平的折线,可分析出最佳组合的趋势。
最后要验证需重复试验。最后用所有数据也可求回归方程。
以张里千为首北大推荐的简单易懂的正交优化法,过去简称极差法。
但张里千著作有些学者说看不懂,本质是和传统参数统计学相悖,所以用其它文献解释其合理性有必要。
(一) 部分正交试验是非参数统计概念。
A:部分正交表设计非随机性。
B:数据太少(哪怕重复8次)难证实是正态分布。而方差分析需正态分布为前提。
(二) 极差法推荐第一轮用小表,而且不重复。
A:《实验统计学》(美:玛.吉.纳特雷拉)P231:
“对于部分析因试验,显然没有重复实验的必要…”
B:不重复的可信度。偶然性背后是必性,重复8次也是小样本。
所以关键水平距离要尽可能拉开,凸现差异性。
(三) 正交表不排交互项:
A:正交表目的寻找最优水平的参数组合,而交互项无直接可调的水平,所以是不可控的。要量化出交互项是为建回归方程。
而极差法不一定要建数学模型,如同0.618黄金分割法,结合分析点线图(趋势图)用2到3轮小表逐步逼出最优水平组合。最后用重复试验验证。
B:主效应、交互作用量化精度。
《多元回归中的交互作用》p35:“在乘积模型中,X和Z的回归系数并非如传统认为的那样代表主效应,相反,这些系数代表的是简单效应。”在有交互作用时,是表的列效应,非主效应。
C:对于不重复试验的疑虑:同上p9:
“单自由度的交互比较是交互分析的核心。它们代表了交互作用的关键检验。”
D:《实验统计学》p239:
“部分析因实验不可能得到全析因设计那样多信息。这种方法所达到的经济性是以因素间的某些交互作用可忽略这个假定为前提的。”(简言之,部分正交试验无法精确量化出交互作用。)
E:不排交互项,可多排因子(其次最好3水平),不少试验失败是漏掉可控因子。
某文献三因子案例,用L8的2水平设计,列入交互项,重复3次,花不少功夫计算交互作用。如用不重复L9排3水平,非线性响应因子、交互作用、最佳组合水平方向一目了然。
(四) 极差法和建模法对比。
A:极差估计因子效应的重要性排序,基本和方差分析一致。
B:三水平点线图,可直观看出非线性响应因子、交互作用及强弱。因子折线非直线是可控因子和响应有非线性关系,是稳健性设计的基础。两线相交有交互作用,夹角大则交互作用大,平行无交互作用。
B:两因子回归方程,最复杂的可能有8个变量,完全析因设计可量化出所有变量。
而现时正交试验都是部分试验,比如回归方程要忽略不显著因子或不显著交互作用。
但不显著不等于没有作用!比如响应曲面,如无交互作用是超平面,而忽略不显著交互作用会影响其凸凹度。
算出的回归方程在实验验证时,常出现不符。但人们用实验误差等理由解释,但回归方程近似性无法回避。
(五)一个重复试验大正交表试验作出的回归方程可信度。
某文献二因子三水平非线性案例,试验用EXCEL做出回归方程,预测最佳水平组合均在第二水平和第三水平之间。
但在点线图上呈现在二、三水之间二个因子折线平行,而一、二水平间折线小角度相交,呈现弱交互作用,最佳组合可能在一、二水平区域,所以可质疑原推断最佳组合的合理性。
用极差法思路:由于两个因子折线均是曲线,二水平处是最大值。所以可用L9表一次三水平试验可解决四因子初选,用非术语即“广撒网”。第二次正交试验设计水平以原二水平为中值水平,上下水平设计为小间隔:即“加密网”。最后共可得出5水平的折线,可分析出最佳组合的趋势。
最后要验证需重复试验。最后用所有数据也可求回归方程。
TA的首页

