【原】SPSS Modeler分析物流发货明细数据：K-MEANS（K均值）聚类和Apriori关联规则挖掘

拓端数据 2023-05-31 发布于浙江

展开全文

全文链接：http:///?p=32633

物流发货明细数据在现代物流业中扮演着至关重要的角色（点击文末“阅读原文”获取完整代码数据）。

通过对这些数据进行挖掘和分析，我们可以发现隐含在背后的供应链运营规律和商业模式，从而指导企业在物流策略、成本管理和客户服务等方面做出更加科学和有效的决策。

相关视频

SPSS Modeler是一款功能强大、界面友好的数据挖掘和分析工具，可以帮助企业对物流发货明细数据进行深入和准确的挖掘分析，提高数据价值和运营效率。

本文将以SPSS Modeler帮助客户分析物流发货明细数据，介绍如何使用SPSS Modeler对物流发货明细数据进行聚类分析和关联规则挖掘，并分析得出有益的结论和建议，为企业的物流运营和发展提供参考与支持。

本研究的数据是一组关于物流的发货明细，数据包括以下字段：项目、指令日期、始发省、始发市、目的省、目的市、收货人单位、品名、数量、签收时间、签收数量、拒收数量和拒收原因。

对数据进行预处理：

（1）补充缺失值。对没有记录的数据缺失采用平均值法，以该字段的平均分数填充。

（2）规范化数据。运用最小-最大规范化方法对数据进行规范化处理，将数据映射到[0,1]区间，计算公式如下。

其中：ymax为该字段的最大值；

ymin为该字段的最小值。

（1）读取数据

选择SPSS Modeler的Source-Excel-Data，在Data选项页中通过Import Files输入框选定Excel格式的成绩表文件，并点击Read Values 按钮，将所有数据读入，如图所示。

（2）K-Means 模型设置

选择SPSS Modeler的Modeling-K-means，将K-Means模型节点添加进数据流来，双击K-Means图标，在弹出的对话框中选择Model选项页，选项页中的参数解释如下：

1）Numbers of cluster：制定生成的聚类数目，这里设置为3.

2）Use Partitioned Data：如果用户定义了分割数据集，选择训练数据集作为建模数据集，并利用测试数据集对模型进行评价。

继续选择对话框中的Expert选项页，如图5所示，对该选项页中的参数做一下设置：

Model选项：选择Expert模式，表示将进行高级模式的选择。

Stop on选项：选择custom选项修改迭代终止的条件：

1）Maximum iterations（最大迭代数）：该选项允许在迭代制定次数后终止训练，这里设置为20.

2）Change tolerance（差异容忍度）：该选项允许在一次迭代中质心之间的最大差异小于制定水平时终止训练。

（3）执行和输出

设置完成后，选中Execute 按钮，即可得到执行并观察到结果。点击VIEW选项卡，可以以图表的形式来显示模型的统计信息以及各个属性在各簇中的分布信息。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：拓端数据 > 《待分类》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

拓端数据

关注对话

喜欢该文的人也喜欢更多

热门阅读换一换