分享

实战秘籍|教你10分钟搞定一份可视化报告!

 资源分享大叔 2018-11-22

能制作可视化报告的方式有千千万。

Excel控若能轻车熟路驾驭VBA,能玩出各种花来,再不济借助图表插件外援也能秒杀一众小白选手。

会编程的,Echarts几十行代码,分分钟出秀;R语言玩得一手数据挖掘,可视化自不在话下;Python爬数据达人,手握matplotlib包打天下。

这么多工具,从哪个入手较好?这也是很多人犯难的。

其实,数据分析大家大可不必垂涎于工具。对于绝大多数的我们,需求在于从万千数据中统计出一些规律,或者某些业务问题想通过分析数据的方法得到求证。

分析工具更多的价值在于辅助分析过程中数据的处理,能够将结论以可视化的方式直观展,最终解决问题。如果在功能上能做到避免写公式写代码,易上手易用,那就更好了

笔者一直主张用BI分析,于数据分析师,节省时间提高效率。于入门,BI也是最简单最好上手的可视化分析工具。

之前分享了《这可能是今年最值得推荐的数据分析工具》,讲解了FineBI的主要功能、特点和基本使用方法。

今天想着重于数据分析的过程,使用FineBI来打造数据分析师的Dashboard报表。

为了更好的帮助大家尝试和实践,文尾公开了数据源及报告展现地址,供大家学习和练习。

一、数据分析的操作思路

数据分析通常是这样切入的,比方说业务上发生了变化,流量下降20%,那么我们就要分析可能的原因,需要多方数据去验证假设。又或者拿到一份数据,思考可以分析的规律点。无论哪种情况,一个完整的数据分析都需要经历数据获取、数据预处理、数据分析与建模、可视化分析及报告撰写的过程。

FineBI的功能模块也是依据这样的分析流程来分的,分为数据连接、数据准备、可视化分析、仪表板驾驶舱、分享仪表板等。

二、认识这个工具——FineBI的工作区

实战秘籍|教你10分钟搞定一份可视化报告!

官网安装好合适的版本,成功激活,设置初始账号密码后,会跳转到这个web页面。

左侧是导航栏,类似于菜单栏。目录类似首页,展现已完成的分析报告,这里默认展现官方的内置demo。

数据准备是连接数据、准备数据,以及对数据进行再加工处理的地方,可进行业务包、数据表、关联、多路径、数据更新、自助数据集等管理。

仪表板即创建可视化分析。管理系统即对整个数据决策系统进行管理的地方,包括目录的设置、外观设置、数据、报表、分享权限等管理配置。

创建是提供给用户快捷新建数据连接、添加数据库表、添加SQL数据集、添加EXCEL数据集、添加自助数据集、新建仪表板的地方。

三、连接/导入数据

制作数据报告,第一步是导入数据,FineBI能从很多种数据源导入数据:如Excel,CSV,XML,以及各类数据库(SQL Server,Oracle,My SQL等),两大主流开源平台(Hadoop,Spark)等等。最常用的方式是连接数据库和导入excel数据。两种方式因为最常用,所以这里都演示操作一遍。

1、数据库连接举例:连接mysql

实战秘籍|教你10分钟搞定一份可视化报告!

2、导入excel数据

同样的数据,用一份excel导入。

第一步:数据准备—添加业务包,业务包是用来统一整理数据表的。这里创建一个台风数据包。点击添加表,新建excel数据集。

实战秘籍|教你10分钟搞定一份可视化报告!

就得到如下的数据明细。这里可以自动识别数据的字段类型,也可以修改字段类型。(举例:有些情况下将时间识别成文本类型,需要手动切换成时间类型,不然会影响后续操作)

实战秘籍|教你10分钟搞定一份可视化报告!

至此,数据就导入成功。

四、数据塑性—自助数据集

自助数据集其实是数据加工的环节。一般我们拿到的数据往往是有空缺值有重复,所谓脏数据,脏数据需要清理,关于数据清洗的处理可以写5000字篇,这里就不多讲了。更常见的情况是分析中需要新建一些字段,这是源数据所没有的。这时候就可以根据需求对原数据进行再加工处理,新建一个用于分析的数据集。再处理的操作包括:选择字段、过滤、分组汇总、新增列、字段设置、排序、左右合并、上下合并、挖掘。

实战秘籍|教你10分钟搞定一份可视化报告!

这里因为分析的比较简单,且原始数据已经很规范,所以暂时还不需要对源数据表进行这些操作,且一些过滤操作可以放到后面创建分析图表的过程中去做。

其实,在自助数据集之前,有个功能没讲到。FineBI有个管理员的说法,这在企业部署中会涉及。管理员可以给不用人分配不同权限下的数据,比如财务的只能看财务和销售的数据,或者一部分财务人员只能看到特定的业务包里的数据,或者部分数据表,这些都是出于数据安全以及流程管理考虑。在管理员准备好数据后,就可以分配给不同人员账号,以及部分权限的数据。如果是个人使用,比如本文所要介绍的分析,BI系统是部署在自己本地的,那自己就是管理员,拥有最高权限。本文的分析暂时不需要用到权限功能,这里只做简单介绍。

实战秘籍|教你10分钟搞定一份可视化报告!

五、可视化分析

到这里数据准备好了,接下来开始正式分析。

实战秘籍|教你10分钟搞定一份可视化报告!

先来观察这份数据,这份数据是我从网上当下来的,展示了1945年——2015年登陆我国的台风信息,包括时间、登陆省市以及台风强度。

那么我们可以汇总统计下历年来台风最常光顾的省份和城市有哪些,一年中哪个时间段是台风频发日,以及台风强度分布。

1、 新建仪表板,即我们说的可视化报告、dashboard,叫法很多。

2、 新建可视化组件,添加刚刚导入的数据集。(图表、查询筛选框等都叫组件,是finebi仪表板的组成元素。)

分析1:各年度登陆我国的台风数量

添加完数据集会进入到这个分析界面。拖拽要分析的字段(记录数—统计台风数量的指标,登陆时间——这里只展示年份这个维度)

实战秘籍|教你10分钟搞定一份可视化报告!

这里要注意,源数据表中一个台风有多行记录,那是因为台风可能同时登陆两个区域,记录了两条信息,所以记录数要依赖CMA编号统计(记录数右侧小三角下拉),以免重复。

其次,这里又添加了一个统计每年台风平均数的指标。

最后再对次图表稍加美化,通常在图形属性和组件样式中:

① 修改线条颜色:图形属性—颜色

② 修改连线为平滑曲线,并且可调整有无标记点

③ 修改该组件标题:组件样式—标题,可调整字体样式

最终得到如下成图:

实战秘籍|教你10分钟搞定一份可视化报告!

能明显感觉到登陆我国的台风呈现一个2~4年的波动变化,且2000年以来,直击我国的台风整体数量有略微下降。

分析2:台风登陆各省沿海城市分布—数据地图

这里演示一下数据地图的制作,用地图直观展现台风登陆我国沿海各省市的分布。

必须将维度创建成地图角色,生成经纬度。

实战秘籍|教你10分钟搞定一份可视化报告!

匹配好数据后生成省份(经度)、省份(纬度)字段。这里要注意检查一些匹配是否正确,我就遇到把辽宁省匹配成宁夏的bug,匹配有问题可以随时调整。

然后将字段分别拖至横轴和纵轴,会自动生成一个填充地图。除此之外还有点地图、热力地图等,这里就用填充地图举例。

填充地图顾名思义,就是用区域的颜色区分数值大小。这里将记录数拖拽到图形属性-颜色,即可看到区分,(颜色可在下拉框中自行选取)。再将记录数拖拽到标签,即可显示登陆该省市的台风数量。

在组件样式——背景中,可以修改GIS地图样式,如下:

实战秘籍|教你10分钟搞定一份可视化报告!

注:关于图表组件的样式,比如标题名(字体大小颜色)、轴线、配色,图表布局等都可在图形属性和组件样式中选择。选项非常多,请读者们自行发挥自己的美学天赋吧!关于数值的计算、过滤排序等操作,都可在横轴、纵轴的指标维度下拉框中找到。

六、可视化报告

其他分析大同小异,篇幅有限,以上只举了两个例子。

图表分析组件完成之后,就是构建可视化报告(dashboard)了。

仪表盘样式中有预设的模板可以直接套用,以下是笔者随便套用的一个模板,更具模板的风格,后面调整了每个图表的样式和配色。好不好看全看个人审美了。

实战秘籍|教你10分钟搞定一份可视化报告!

实战秘籍|教你10分钟搞定一份可视化报告!

小结

总的来说,使用FineBI制作可视化报表,最关键的还是在于数据处理,数据处理好了,报表绘制起来才能得心应手。由于数据之前在excel里已经做了一些处理,所以拿到的数据基本可以直接上手分析。

在充分掌握了数据处理技巧后,就可以将更多精力放在各种各样的可视化图形上。FineBI内置了很多配色及风格,接下来大家可以尽情发挥自己的想象力制作各种酷炫的可视化报表,尽量搞清楚可视化制作中所有内置图形的绘制方法,以及样式调整。

最后,附学习资料

1、Mysql数据源

  • URL:jdbc:mysql://192.168.0.108/a
  • 用户名:root
  • 密码:123456

2、Excel资料可私心回复“可视化报告”获得!

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多