1 回答
R-Sq表示的是能被回归方程解释的部分所占的比例,简而言之是因变量y中的总波动,回归方程的自变量能够解释的总波动的比例。当然,这个值越大越好,但最大值只能是100%
这里是和因变量的多少有关系的,随着回归方程里面的自变量x增加,R-Sq的值越大,因为自变量x参与解释总波动的比例在增加。
这个时候就会存在一个问题,一些不显著的因变量x添加到回归方程中使R-Sq的值增大,想当然的会认为模型拟合的很好。
为了解决这种误判,于是引申除了R-Sq(adj),也就是调整后的拟合优度系数,表示的是删除了所有不显著的自变量x之后的模型,当然,这个值越大,代表模型拟合的越好,但最大值也只能是100%,而且R-Sq与R-Sq(adj)差值越接近,说明模型越好。