分享

如何使用数据挖掘方法处理时间序列数据?

 江山多娇美如画 2018-07-27

谢邀。时间序列数据是在特定时间点记录的一系列数据点,通常以规则的时间间隔(秒,小时,天,月等)记录。

每个组织每天都会生成大量时间序列数据,无论是销售额,收入,流量还是运营成本。

时间序列数据挖掘可以为长期业务决策生成有价值的信息,但在大多数组织中它们未得到充分利用。以下是利用时间序列数据集的几种可能的数据挖掘方法:

趋势分析

一般单单根据时间绘制数据可以产生非常强大的数据模型,时间序列数据的一个非常基本的用途就是理解被测量的时间模式/趋势。在企业中,它甚至可以提供关于典型商业周期总体方向的早期预测方法。

异常值/异常检测

时间数据集中的异常值表示异常。无论是否需要(例如利润率)(例如成本),在数据集中检测到的异常值可以帮助防止意外后果。

检查冲击/意外变化

时间序列数据可以识别变化(预期或意外)和异常,检测噪声中的信号。

关联分析

通过绘制双变量/多变量时态数据,很容易(只是在视觉上)识别任何两个特征之间的关联(例如,利润与销售)。这种关联可能会也可能不会暗示因果关系,但这是在更高级的统计分析中选择影响输出变量的输入特征的良好起点。

预测分析

使用历史数据预测未来值是一种常见的方法论方法 - 从简单的外推到复杂的随机方法,如ARIMA。譬如像高级统计分析(如面板数据模型(固定和随机效应模型))严重依赖于多变量纵向数据集。这些类型的分析有助于业务预测,识别解释变量,或仅帮助理解数据集中要素之间的关联。


我会在这里发布所有与科技、科学有关的有趣文章,欢迎订阅我的头条号。偶尔也回答有趣的问题,有问题可随时在评论区回复和讨论。

(码字不易,若文章对你帮助可点赞支持~)

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多