来源:Python 技术「ID: pythonall」 数据分析和机器学习是目前的热门,相关书籍教程汗牛充栋,大多数都在讲环境创建、数据处理、工具应用,以及各种理论和算法,虽然实践起来难度不大,但学习之后还是云里雾里,不知道怎么应用。今天我们从另外的角度上了解下数据分析的基本步骤,并结合一个分析案里,体验一次数据分析的过程,不用写代码噢。 数据分析过程数据分析是对数据和业务信息反复处理的过程,具有螺旋上升的特点,每个阶段,可以分解为如下几个过程:
数据分析就是不断的这这几个过程阶段反复,由于有的验证过程麻烦,分析过程可能持续很久 分解和评估阶段,可以借助数据分析工具、编程来提高处理效率 在评估阶段,可以用图形化工具对数据进行展示,以便方便的看出数据关联和规律 下面我们结合一个实例,对各个过程阶段进行进一步了解 任务来了我们接到一个任务,任务来自一个化妆品公司,最近他们遇到一些麻烦,想提高保湿霜产品的销量,但所有尝试都没效果,最近他们调整了广告策略,还不确定这个调的效果如何,期望我们能帮他:
收到任务,开干 第一步 确定问题、收集数据别急,虽然有了任务,且给了目标,但是开始前,需要进一步确定问题,并为解决这问题收集必要的数据,否则可能会经历一场没有目的地的旅行。 首先要确定调整策略是否有效,那么我们需要一些调整前和调整后的销量数据,下面是得到的数据:
另外需要进一步了解业务,以及用户对这件事情的认识,以便收集更多的信息,并且明确可量化指标,可量化 是个重要的概念,客户会说要提高销量,但是应该提高多少呢?还会说看看什么方式行不行,那么什么才叫行或不行呢?这些都是需要在确定问题的部分弄清楚的。实际中,不可能将所有问题都明确化,需要采取循序渐进的策略,逐步靠近目标
通过对业务方的调研,得到了如下信息:
第二步 整理和分解数据收集了数据,并且明确了目标(主要是可量化)之后,就可以对数据进行分析整理了,如有必要还需要对问题进行拆分,比如要提高销售额这样含糊不清的问题,应该拆分成哪些小的步骤,让这些问题可管理、可解决,下面是分解后的:
接下来,我们需要将数据和客户的目标相结合,从中得到一些推论和表述 因为客户所说的可能并非事实,另外单从数据可能无法还原业务过程 现在通过客户表述,以及从数据上得到的结果,可以得得到一些推论
从客户的观点中可以得到:
从收集到的数据中可以得到:
通过对数据的比较和分类,我们对手头上的数据有了更好的认识,并进一步了解了客户的业务时如何展开的 第三步 分析评估分析评估和数据分解一样,关键就是比较,将客户观点和数据块放在一起比较。 分析过程是个发挥主管能动性的过程,需要将自己的假设融入到分析结果中,所以可以说分析结果是分析师的信用基础,即好的结果有助于提升分析师的信用,反之亦然。 无论在建构复杂的模型还是简单的模型,数据分析就是你的一切:你的信念、你的判断、你的信用 加入了你的思路和分析,将从你和客户那里得到好处: 来自自己的好处:
说到底,就是不只是展示数据本身,而是了解了业务结合自己分析的思考结果,是自己对这个这件事情的一个认知 来自客户的好处:
相反,如果只是展示了数据本身,没有自己的思考和判断,相当于是在说:
如果是这样,那你将失去客户的信任,甚至做出过头的结论,最后使用户蒙受损失 最后,给客户提出建议的形式和方法至关重要:
第四步 得到决策经过分析思考之后,就可以完成最终的分析报告了,注意报告的形式,和包含的内容,虽然是个简单的报告,但麻雀虽小五脏俱全:
分析报告如下:
验证决策如果分析报告严谨可信,将会被采用,并付诸行动,但并不意味着分析工作结束了因为
而造成我们认知局限性的原因有多种:
如果不对结论进行验证的证明,就相当于给出了一个无法证明的结论,参考价值将大大缩减 我们知道,现代的科学理论都有建立在 严格的科学逻辑证明 基础上的,才使得我们能在科学理论上,创建出美好的现代化世界, 我们的数据分析是科学的,所以需要是可证明的。 总结今天的文章虽然描述的是数据分析,但是却没有用到常用的数据分析工具,也没有使用高深的数据分析数据公式,不过这是数据分析的基础和开端,明白了数据分析的意义和过程,才能更好的使用各种工具,让我们在数据分析过程中事半功倍,否则将会迷失在众多工具和理论中,不知所终。 文章中的示例主要来自于我学习数据分析过程中的《Head First 深入浅出数据分析》一书,如有兴趣可以参考,值得阅读。 参考
|
|