今天的文章中,我们将重点讨论在数据科学研究中,数据分析问题的四种类型:描述、诊断、预测和规定。 在与数据科学领域的年轻数据分析师们交谈时,我经常问他们,什么是他们所认为数据科学家最重要的技能,他们给出的答案五花八门。 我告诉他们的答案是,数据科学家最重要的技能是将数据转化为清晰而且意义明确的见解。这是一个经常被忽视的能力,瑞典统计学家Hans Rosling正是因此而闻名。 谈到这个话题有必要谈论一下帮助人们理解数据分析在形成有价值的见解过程中的角色的作用的工具。 其中一种工具就是分析的四维范例。 简单来说,数据分析可以分为四个主要类别,我将在下面做出详细解释。 1.描述:发生了什么事? 这是最常见的数据分析形式。在商业领域,它为分析人员提供了业务中关键指标和措施的。 每月损益表正是这样的一个例子。 类似地,数据分析师可以通过大量的客户数据,了解客户的统计信息(例如我们的客户中30%是个体经营者),这种可以被归类为“描述性分析”。 利用有效的可视化工具能够增强描述性分析的信息。 FineReport 2.诊断:为什么会发生? 数据分析的下一步是解析性描述。 在对描述性数据进行评估时,诊断分析工具将使分析师具备深入分析的能力,从而剥离问题的根本原因。 精心设计的商业信息仪表板包含读取时间序列数据(即多个连续时间点的数据),并具有数据过滤和挖掘的能力,可进行此类分析。 比如查看数据地图,我发现江苏的市场销售额较高,想知道是什么原因?于是点击该省份,能定位到各类产品的销售数据和响应的合作客户数据。 FineReport 3.预测:将来会发生什么? 预测分析是为了预报。 无论是将来发生事件的可能性,预测可量化的数量还是估计可能发生事件的时间点,这些都是通过预测模型完成的。 预测模型通常利用各种可变数据进行预测。组件数据的变异性将与可能预测的关系(例如,一个较老的人,他们对心脏病发作的敏感程度越高,我们会说年龄与心脏病发作风险呈线性相关)。然后将这些数据一起编译成分数或预测。 处在一个巨大不确定性的世界中,预测可以帮助人们做出更好的决定。预测模型是许多领域中最重要的模型。 4.规范:我需要做什么? 在价值和复杂性方面的下一步是规范性模式。 规范模型利用对发生的事情的理解,为什么发生了这种情况以及各种“可能发生的”分析,以帮助用户确定采取的最佳行动方案。 规定性分析通常不仅仅是一个单独的行动,而且实际上是其他一些行动。 一个很好的例子是交通应用程序能够帮助您选择最佳路线回家,并考虑每个路线的距离,每个路上可以行驶的速度,以及当前的交通限制。 另一个例子是制作考试时间表,保证所有学生的时间表不存在冲突。 因此,虽然不同形式的分析可能为企业提供不同数量的价值,但它们都具有自己的用处。 |
|