关于回归分析Radj2的问题

为何比较两个回归模型的好坏是比较R2和Radj2的接近程度呢？我看到一个解释是因为R2会因为自变量个数的增加而变大（不管这个自变量是否显著），R2总会增加一些，因此单纯2个回归模型的R2就没有价值。所以就需要引入Radj2.
公式： R2=1-SSE/SST Radj2=1-【SSE/(n-p)】/【SST/(n-1)】 n=观测值总个数 p=回归方程总项数

Radj2就是扣除了回归方程中所受到的包含项数的影响的相关系数，所以可以更准确的反映模型的好坏。最后文章总结：要判断两个模型的优劣可以从Radj2与R2的接近程度来判断，二者越小，模型越好。
那么问题来了：

首先比较两个模型的好坏对于R2来说，只要比较接近程度就行了吗？如果模型1（R2=50% Radj2=51%）如果模型2（R2=95% Radj2=85%）那难道说模型1（R2-Radj2=1%）比模型2（R2-Radj2=10%）要好？
第二，从上面的描述来看，Radj2已经扣除了回归方程项数的影响（实际就是除以自由度，变成1-MSE/MST）,那我直接比较两个模型的Radj2不就行了吗？

反正就是从他的解释中我还是无法理解为何是看R2-Radj2的差值，而不是直接比较两者的Radj2就行了。望详细解释~~~

对“好”的回答一定要点个"赞"，回答者需要你的鼓励!

已邀请:

1 个回复

Jeff_Chou (威望:197) (江苏苏州) 汽车制造相关 Six Sigma-er - 寄蜉蝣于天地渺沧海之一粟

赞同来自: lashasha 、世界两侧

谢邀！
1. 模型拟合的好坏程度要看R2和adj R2的值，一般要>70%说明模型有比较好的使用价值，>90%就很好了。
R2与adj R2差异，用来判定所选择的因子是否存在无意义的因子；就好比如夏天冰激凌的销量Y跟温度X1存在线性相关，是实实在在的影响，但你把蚊子的数量X2作为因子去回归得到R2会增加，但adj R2不一定；结果就是R2和adjR2存在较大差异，说明选择的Xi中有与Y不相干的加进去了，R2会随Xi的增加而增加
2. 不同的回归模型放在一起作比较不太合适吧，需要很多前提条件来保证apple to apple的。通常会比较的是同一回归模型里的R2和adj R2.

1 个回复，游客无法查看回复，更多功能请登录或注册

关于回归分析Radj2的问题

1 个回复

发起人

问题状态

关于回归分析Radj2的问题

与内容相关的链接

1 个回复

发起人

问题状态