分享

精益6sigma大数据AI在家电行业的应用

 贝思德管理 2018-06-01

1. Train vs Test Error

In [20]:
train_MSE= np.mean((y_train - multi_regression_model.predict(X_train))**2)
test_MSE= np.mean((y_test - multi_regression_model.predict(X_test))**2)
print('The train MSE is {}, the test MSE is {}'.format(train_MSE, test_MSE))

train_R_sq = multi_regression_model.score(X_train, y_train)
test_R_sq = multi_regression_model.score(X_test, y_test)
print('The train R^2 is {}, the test R^2 is {}'.format(train_R_sq, test_R_sq))
The train MSE is 1.7273421332518721, the test MSE is 2.9967985497570164
The train R^2 is 0.9251604192159106, the test R^2 is 0.9563745903333054

2. Uncertainty in the Model Parameter Estimates

LSSAI-06-1.png

Evaluating the Significance of Predictors

In [23]:

predictors_multiple = ['X1', 'X2', 'X3']
predictors_simple = ['X1']

X_train_multi = add_constant(train[predictors_multiple].values)
X_test_multi = add_constant(test[predictors_multiple].values)

X_train_simple = add_constant(train[predictors_simple].values)
X_test_simple = add_constant(test[predictors_simple].values)

1. Measuring Significance Using F-Stat, p-Values

In [25]:
multi_regression_model = sm.OLS(y_train, X_train_multi).fit()
print('F-stat:', multi_regression_model.fvalue)
print('p-values: {} (X1), {} (X2), {} (X3)'.format(*multi_regression_model.pvalues))
F-stat: 309.047835892
p-values: 1.6576100839525376e-14 (X1), 5.909290608102625e-32 (X2), 3.6315773015493156e-12 (X3)

4. The Effect of Number of Predictors on R^2

LSSAI-06.png

Multiple Linear Regresssion with Interaction Terms

Polynomial Regression

Effect of Polynomial Degree on Model Performance

LSSAI-06-2.png


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多