分享

关于R square的一点总结与心得

 金天瑞 2012-12-01
分类: 上班心情 2007-11-22 10:47
看郭志刚书回归这章关于R square的一点总结与心得:

R square称为方程的确定系数,0~1之间,越接近1,表明方程的变量对y的解释能力越强。

对于回归方程来说,总结了以下几个意义:

1R square可以作为选择不同模型的标准。如果在拟合数据之前,不能确定数据到底是什么模型,那么可以对变量的不同数学形式进行拟合,然后看R square的大小,R square大的模型,说明这个模型对数据拟合的较好。

2.在数据的关系存在非线性可能情况下:

(a)不一定R square越大拟合越好,因为R square只是回归平方和占总平方和的比例。比如,在那四幅著名的图里面,R square都等于66%,并且都是线性拟合,但是他们的数据点完全不同,有些是因为特异案例的存在,致使数据拟合出来是线性的,而事实上并非如此。所以,应该在拟合之前观察散点图,然后去掉特异值。

(b)如果一个模型的R square很小,不一定代表数据之间没有关系,而很有可能是选择的模型不对,因为数据之间也许的其他的函数关系,比如对数关系或者指数关系。这意味着需要对数据作进一步的拟合。(当然,最好的方法应该是在数据拟合之前先观察散点图)。如果是线性模型,那么R square才是方程拟合优度的度量,R square越大,回归方程拟合数据越好,线性关系越强。

3.当自变量个数增加时,尽管有的自变量与y的线性关系不显著,R square也会增大。R square受自变量个数与样本规模影响。这点在上次老师上课时也从数学原理阐述过。对于这点,采用Adjusted R square进行调整。

4.当想确定方程中的每一个自变量对y的边际解释能力时,应该确定每个自变量的偏确定系数(partial coefficient of determination)。注意,偏确定系数反映的是新加入回归的变量所解释的百分比,而这百分比是以前一步回归所未能解释的部分为整体,而不是以y的总变化为整体。也就是说,x1x2共同解释的y的贡献,已包含在x1解释的y的贡献里面。偏确定系数的意义是,用于判断自变量的重要性。但是,在遇到虚拟变量时,计算这个的意义不大。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多