分享

请别叫我“表妹”,我是数据分析师......

 运营商段子手 2021-05-25

七年前,我阴差阳错地在填报志愿的时候选择了统计学专业。在那个时候,大数据的概念还没有兴起,很多人还没分清楚统计和会计的差别,我也和很多刚刚结束高考的懵懂少年一样,带着憧憬走进校园,开始和高中完全不同的生活。 

统计学专业的学习可以说是非常枯燥的,专业课程中绝大多数都是和数学相关,基本是一言不合就算微积分。就这样过了四年,大多数同专业的朋友都去了银行或者金融机构,也有少部分考了公务员,在各省份的统计局做调研、统计等相关的工作。对这些工作都没有兴趣的我选择了继续读书。 

在我继续读书的两年里,大数据的概念飞速崛起,数据分析师开始得到广泛关注。这两年间,我也利用假期时间半只脚踏入这个行业地进行了总计约一年的实习。也就是从这段时间开始,好像霎时间全行业都在提大数据,每个人都在讲大数据。因为专业相关、兴趣所在,即便在读书期间,我也关注着这个行业的发展。当时盘算着毕业之后能正好趁着大数据的风势找个对口的工作,为这六年乏味的学识寻找一个学以致用的出口,现在看来刚刚好也算是如愿了。 


进入这个行业之前,我曾经以为技术过硬就是好分析师。工作之后,我才渐渐明白自己的技术崇拜并不能带来优秀的口碑。在这一两年的实践中,我跟着优秀的分析师们学习、共事,参与了日常的建模分析,也算有了一些心得体会。

 

今年初,我们部门在协助业务人员给流量放心卡做简单分析,这需要运用描述统计的分箱思维,对流量、语音、ARPU在不同区间内的用户进行分析,以取代过往仅仅使用均值进行的分析,在这一步中,统计学的知识是基本支撑。在对养卡行为进行分析时,将疑似养卡用户的语音拨打行为在时间和空间两个维度进行可视化,可以更清晰地展示养卡用户“时间集中”、“位置集中”的语音拨打行为特点。若不是经历了可视化的步骤,养卡用户的特点将仍然是模糊的,不能被挖掘出来。在进行重入网用户识别时,整个建模过程中,我们经历了三次和业务人员共同商讨模型优化的过程。顺利的沟通和协调能力使这些迭代过程帮助建模从过程到结果都得以提升。在进行流失预警用户的分类识别时,需要用到分类器算法。数据分析方法中分类器有很多种,其中不乏支持向量机、随机森林等复杂度很高的分类器。理论上来说,这些分类器都是可以使用的。但基于常识,最终我们还是选择了解释性强、实用性强的决策树来进行分析,在同样达到目的基础上,减少了更多的学习、沟通和解释成本。 

经过这些实际的工作过程,我才大致琢磨清楚,真正出色的数据分析师,第一要义必定是能够将数据赋予价值。甚至,毫不夸张地说,优秀的大数据分析师应该被定义为“数据科学家”。即便现在大众对数据分析师的期望变得越发明朗,但他们究竟是怎样的形象,人们并不完全清楚。很多朋友问我这份工作究竟是做些什么,和做商业智能有什么差别。其实,无论是认为统计学就是数据分析,还是认为拥有一些分析背景的商业智能专家就是优秀的数据分析师,都是人们最常见的误解。相对于商业智能专家或者其他专家而言,优秀的数据分析师(或者说数据科学家)更需要掌握一些差异化的技能。 

首先,必不可少的基础是统计学。对于很多大学生来说,作为必修的统计学课程是他们毕业前的噩梦。但要成为数据分析师,统计学知识是必不可少的储备。也就是说,数据分析师并不只是懂得统计学,而是还要掌握模型和方法论,同时还要知道如何最优地应用它们。也就是说,要成为拥有强大的分析技能,并掌握像R、Python这样的数据分析工具相关知识的统计学家。只有知其然,知其所以然,才能更好地在实践中指导应用。 

在统计学的知识背景上,还需要叠加商业智能的知识储备。也就是说,商业智能的知识是将数据分析师与数据技术开发人员的技能差异化的重要部分。数据分析师不仅仅需要能够与数据仓库技术开发人员沟通,了解开发人员的行话和他们所做的工作,还需要在这种沟通当中利用商业智能的知识指导数据前期的准备工作。 

在数学技能和商业基础上,数据分析师还需要有业务解析的能力。数据分析师并不是独立于商业过程而存在的,对某一个案例或项目的了解需要分析师与业务人员深度的讨论,这样才可以明白业务人员的目的。在所有基于商业背景的数据分析中,分析师都应该嵌套在整个分析流程中。在所有商业讨论的前期就参与进来,以便迅速地领会某些商业概念,给出分析过程的指导意见,积极地参与对所需交付成果的定义。 

对分析结果的展示需要分析师在可视化方面的能力。数据分析的一大壁垒,就是分析结果的展现。对于大部分对数据分析零掌握的业务人员来说,理解纷繁复杂的数据分析结果需要的学习成本太高,耗时耗力,收效甚微。也许初阶的分析结果可以通过简单的图表来展现,但更高阶分析的结果往往很难通过传统的可视化方法展现出来。因此,数据分析师需要拥有各式各样可视化工具的知识和有效技巧。只有能够真正清晰明了的展示分析结果,用最简单易懂的方式诠释隐藏在数学模型背后的商业意义,才可以称为优秀分析师在可视化上的造诣。 

懂沟通,会描述,也是分析师不可或缺的技能。对分析结果和进程的展示报告,与得到这些结果的过程同样重要。得到高阶的分析结果往往是个重复迭代的过程。一旦得出第一代结果,分析师应该主动与业务人员沟通,让业务人员的评价成为下一次迭代分析的部分依据。分析师需要具备沟通能力,就是为了刺激这个迭代的过程。此外,数据分析师还应该能够讲述分析的结果。因此,讲故事的技能也必不可少。总的来说,沟通和表达能力也是数据科学家不可或缺的元素之一。 

好奇心能成就一个优秀的分析师。数据分析师虽然参与分析,但在业务领域方面却未必是专家。所谓三人行必有我师,好奇心可以驱使他们优化自己的数据科学技能、分析工具和技术知识,也可以积累商业知识和分析经验。在工作中遇到的所有不明白的小细节,都可以不断地记录下来并进行学习,以保持对新鲜事物的敏感度。毫不夸张地说,好奇心是数据科学家保持思维活力的秘密武器。 

数据分析师需要掌握大量的工具和技能,只有拥有创造力才能实现这一点。也就是说,他们需要在如何使用这些工具、如何运用这些技能等方面表现出创造力,需要在众多知识储备和工具应用中寻找适合的方式方法来进行分析。在了解需要分析的案例之后,他们应该能够就如何分析某个特定议题、如何展现某些数据等具体问题提出创新的建议。从数据和算法的角度提出创新的分析方向是数据科学家与商业智能专家相比之下的差异化优势。 

最后,但是同样重要的一点是,数据科学家应该将常识明智地应用在他们的分析活动中。如果某个案例只是简单地需要一个线性回归或者一个条形图,数据科学家应该能够不去过度分析它。不能为了展示自己渊博的知识储备或炫酷的分析技能而将简单的事情复杂化。也就是说,一切分析都应该基于合理、高效等原则进行。数据科学家真正应该提供的是对数据的洞察力和具有附加值的信息,而不是改造世界。 

以上总结未必详尽,但也从一定程度上说明了优秀的数据分析师所需的广泛技能。扪心自问,对于提及的每一点,我都还处在初阶,前方还有漫漫长路等待求索。当然,于我而言,我感谢这个行业给了我一个机会,使我六年的专业知识能够在大数据的风头浪尖得以实践。我也深知,只有聚焦核心方向,有目的有方法地充实自己,才有可能缩短和理想的差距。 

然而在大环境下,大众对数据分析的认知参差不齐,现实给分析人员的机会稀缺,才造成当下的人才缺口。倘若公司能够在重视数据规模及质量的同时,也重视数据科学家的培养及认可,定能在大数据时代的发展路上如虎添翼。



作者】联通广西分公司大数据中心 张超婧


小手一抖,立马转走!

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多