线性

一元线性回归

为什么要使用回归方程式:
1）为了发现暂定的Vital Few(少数致命缺陷），即寻找潜在的关键少数"X"
2）为了判定Y值并使其最佳化
3）为了决定哪些X因素值上‘Y'成为最佳化
回归模型中的变量：
＃因变量或称响应变量y(Dependent Variable or Response):由自变量来解释其变化的变量
＃自变量或称影响因素、解释变量 x（IndependentVariable or Predictors)：给定的或可以控制的、用来解释、也测应变量的变量。
http://my.6sq.net/batch.download.php?aid=2066
SST(Sum of squares of total):总的平方和
SSR(Sum of Squares of Regression):回归平方和
SSE(Sum of Squares of Errors):误差平方和（残差平方和）
SST=SSR+SSE
MSE(Mean squares of errors）：估计的均方误差，是总体误差项的方差(Error of Coefficient)的估计量：
MSE=SSE/fe=SSE/n-2
{Note: 在Minitab中，SE Coef=sqrt(MSE)
SE Coef :应是系数的标准误差: Standard error of coefficient.因为我们计算得到的回归系数是基于有限的样本,是用最小二乘法得到的估计值. 如果有无数组类似的
样本就会得到无数组系数,各不相同.真实的(总体)系数是不可能得到的.SE Coef 用来表征这种离散性,即不同系数的标准偏差.}
Coefficient of determination判定系数（r2):估计的回归方程拟合优度的度量，表明Y的变异性能被估计的回归方程解释的部分所占比例。
r2=SSR/SST=1-SSE/SST
一元线性回归模型预测
1）点估计
前提：回归方程经过检验，证明X和Y的关系在统计上是显著的。
注意：利用点估计得到的Y平均值的点估计值和Y的一个个别值其结果是相同的；
点估计不能提供估计量的精确度
在样本自变量取值之外进行预测，要可别谨慎
2）回归预测的置信区间
Minitab:
Regression-Graphs
Regular:用残差的原始数据Response-fit
Standardized:绝对值大于2时算做比较大，Minitab显示这些值作为不寻常的值并用R来标识。（Residual)/(STD of the residual)
Deleted:计算第i个残差时把第i个观测值去掉（residual).(STD of the residual)
Residual Plot:是回归模式是否适当进行检查的分析工具
1）残差的平均值始终是零
2）残差具有正态分布
3）残差应是随机分布
以上是读《回归分析/Regression Analysis》写的笔记，感觉这个教程不错，在此感谢Steven Li能和大家分享这个教程。
教程地址：http://bbs.6sq.net/viewthread. ... %25F6
附件:

对“好”的回答一定要点个"赞"，回答者需要你的鼓励!

已邀请:

4 个回复

chenhougang1980 (威望:0)

赞同来自:

受教了，谢谢了。。

4 个回复，游客无法查看回复，更多功能请登录或注册

一元线性回归

4 个回复

发起人

问题状态

一元线性回归

与内容相关的链接

4 个回复

发起人

问题状态