一、数据预处理
关注SPSSAU 数据分析 简单一点 论文问卷 快人一步 数学建模国赛 SPSSAU出品 · 必属精品 · 建议收藏 ↓↓↓↓↓↓↓↓ SPSSAU 数学建模常用方法大致可分为四大部分:数据预处理、基本描述、建模、模型评价,如下图:
一、数据预处理 国赛的数据预处理是指进行数据的清洗和变换,预处理的质量会直接影响到后续建模和预测的准确性。数据清洗也就是我们常说的缺失值处理和异常值处理,数据变换是指对数据进行标准化、归一化等无量纲化处理,常见的数据预处理方式见下图: 异常值也称离群值,其数值明显偏离它所属样本集的其余观测值。忽视异常值的存在可能会对建模结果产生不良影响。
异常值处理通常有以下4种方式: 对缺失值进行处理方法通常有删除、填充、插值3类方法,说明如下表: 对于异常值和缺失值的处理,可以使用SPSSAU【数据处理】模块的【异常值】方法进行处理,操作如下: 点击下方链接跳转至相应方法帮助手册: 量纲处理是指通过数据变换来消除原始变量的量纲影响的方法,使模型更加稳定和准确。常见的量纲处理方法包括标准化、归一化、中心化、正向化、逆向化、适度化等等,说明如下: SPSSAU提供17种数据无量纲化处理方法,在【数据处理】模块选择【生成变量】操作如下: 选择合适的无量纲化方法取决于数据的分布特征和后续建模的需求。通常需要尝试多种方法并比较效果。点击下方链接跳转至相应方法帮助手册: 二、描述性分析 在数学建模中,描述性统计分析是一种基本的数据探索方法,是理解数据特征的重要步骤。它帮助模型开发者理解数据的基本特征、分布情况以及变量之间的关系。
点击下方链接跳转至相应方法帮助手册: 三、建模 数学建模关键的步骤就在于模型的选择与构建,根据问题的性质选择合适的模型类型,如分类模型、评价模型、预测模型等。 (1)聚类分析 常用的聚类分析分为K-means聚类、K-modes聚类、K-prototype聚类以及分层聚类。其中前三种聚类方法是按行聚类(R型聚类),分层聚类是按列聚类(Q型),最常用的为K-means聚类,各自适用场景说明如下表: 点击下方链接跳转至相应方法帮助手册: 点击下方链接跳转至相应方法帮助手册: 点击下方链接跳转至相应方法帮助手册: 多元线性回归 四、模型评估 在进行模型构建与分析时,模型评价是非常关键的一步。合适的评价指标可以帮助我们准确地衡量模型的性能,从而进行优化和改进。然而,不同的模型和应用场景需要使用不同的评价指标。下图为回归模型和分类模型常用评价指标: 关于模型评价常用指标可以查看下方文章,已经做过总结: 以上就是数学建模竞赛可能涉及到的大部分模型以及方法,使用SPSSAU系统都可以快速完成,即便是不会建模的小白,也可以冲刺一下奖项哦~ ![]() 以上就是今天的全部内容啦~ 若您想看其他干货内容 请在评论区告诉SPSSAU 数据分析救命神器 让你的数据处理 非常简单! ![]() 点击下方 跳转至SPSSAU官方账号 ![]() |
|