您还没有绑定微信,更多功能请点击绑定

关于回归分析Radj2的问题

为何比较两个回归模型的好坏是比较R2和Radj2的接近程度呢?我看到一个解释是因为R2会因为自变量个数的增加而变大(不管这个自变量是否显著),R2总会增加一些,因此单纯2个回归模型的R2就没有价值。所以就需要引入Radj2.
  公式:   R2=1-SSE/SST       Radj2=1-【SSE/(n-p)】/【SST/(n-1)】  n=观测值总个数  p=回归方程总项数

Radj2就是扣除了回归方程中所受到的包含项数的影响的相关系数,所以可以更准确的反映模型的好坏。最后文章总结:要判断两个模型的优劣可以从Radj2与R2的接近程度来判断,二者越小,模型越好。
那么问题来了:
  1. 首先比较两个模型的好坏对于R2来说,只要比较接近程度就行了吗?  如果模型1(R2=50%  Radj2=51%)  如果模型2(R2=95%  Radj2=85%)  那难道说模型1(R2-Radj2=1%)比模型2(R2-Radj2=10%)要好?
  2. 第二,从上面的描述来看,Radj2已经扣除了回归方程项数的影响(实际就是除以自由度,变成1-MSE/MST),那我直接比较两个模型的Radj2不就行了吗?

反正就是从他的解释中我还是无法理解为何是看R2-Radj2的差值,而不是直接比较两者的Radj2就行了。望详细解释~~~

对“好”的回答一定要点个"赞",回答者需要你的鼓励!
已邀请:

Jeff_Chou (威望:197) (江苏 苏州) 汽车制造相关 Six Sigma-er - 寄蜉蝣于天地 渺沧海之一粟

赞同来自: lashasha 世界两侧

谢邀!
1. 模型拟合的好坏程度要看R2和adj R2的,一般要>70%说明模型有比较好的使用价值,>90%就很好了。
    R2与adj R2差异,用来判定所选择的因子是否存在无意义的因子;就好比如夏天冰激凌的销量Y跟温度X1存在线性相关,是实实在在的影响,但你把蚊子的数量X2作为因子去回归得到R2会增加,但adj R2不一定;结果就是R2和adjR2存在较大差异,说明选择的Xi中有与Y不相干的加进去了,R2会随Xi的增加而增加
2. 不同的回归模型放在一起作比较不太合适吧,需要很多前提条件来保证apple to apple的。通常会比较的是同一回归模型里的R2和adj R2.

1 个回复,游客无法查看回复,更多功能请登录注册

发起人

lashasha
lashasha

弄懂每一个背后的公式

扫一扫微信订阅<6SQ每周精选>