全文链接:http:///?p=28144作者:Yuanchang Luo近段时间,美国总统大选引起了世界各国的关注。共和党候选人唐纳德·特朗普和民主党候选人乔·拜登将角逐总统。两党候选人在金融贸易、经济金融治理以及防控措施等重点发展领域有着不同的立场和纲领。不同的立场的候选人对美国甚至全世界的经济发展有着一定的影响,本文结合具体数据,定量分析不同候选人对美国经济发展的影响。 解决方案任务/目标根据美国各指标数据以及两位候选人的不同 政策,分析出对美国经济的影响。 数据源准备在美国政府公开数据集上搜索数据,共 26 类, 并且用 GDP 来反映美国经济。得到数据后, 由于是时间序列数据,因此通过拉格朗日插值 法补充空值。并且,由于是美国政府公开的数 据集,因此默认异常值,即较大较小值是由实 际历史因素导致的,不作处理。 特征抽取首先经过观察特征间的相关矩阵以及和因变量的相 关性,初步剔除 7 个与因变量相关性非常低且指标 间相关性较高的指标,使用剩余19个自变量作为 回归分析的指标。(剔除掉的指标:'美国个人收入 中位数','个人所得税(最高)','个人所得税(最低) ','商品和服务出口','金融资产净收购','劳动力市场状 况指数','失业率') 建模多元线性回归,一般应用与多个特征指标的回 归问题。在多元线性回归的过程中,除了考虑模型的 AIC 最小外,还需考虑模型间自变量相互的关 系对因变量的影响,即多重共线性,通过 VIF 来剔除相关自变量。ARIMA,一般应用在时间序列领域上。ARIMA 模型是指将非平稳时间序列转化为平 稳时间序列,然后将结果变量做自回归(AR) 和自平移(MA)。 相关视频 模型优化1.通过 VIF 准则剔除相关的自变量:上图为 VIF 最初结果和最终结果。进一步筛选 7 个指标进行预测。 2.通过 AIC 准则选择最优模型结合各因素的 t 检验以及模型的 AIC,通过向 前向后选择的方法,选择出最优的回归模型。
结合上图,确信此回归模型表现良好。 |
|