分享

开源分析方法 | 用Tableau Public做数据分析

 豆豆samuel 2018-06-10

小编某天刷论坛的时候看到这样一个贴:一个习惯python可视化数据的小伙被展示了把tableau之后感叹道:“这就像是,你搭了一个mysql集群后发现,公司有1000核的20年oracle授权!”。拿python画了许久图的小编心情如下:

Tableau是一款商业智能(BI)软件,可以连接无论是电子表格,数据库还是hadoop或是云服务的多种数据,简单易用,可视化内容丰富。Tableau public是Tableau系列中的一款开源软件,提供了很多分析和可视化功能,下载网址:https://public./s/。

对于清洗后数据的常规可视化,tableau极大的解放了使用者花在作图上的精力,简单易操作的数据下钻功能,使使用者更集中在数据和可视化后的分析上,其仪表板能系统地展示数据,连动交互多种数据图表,直观的发现数据间的联系或变化,用数据挖掘故事。

与之相比,python具备全栈分析能力,可以完成数据的获取,清洗,分析,可视化的全过程,具备极高的设计自由度,而弊端呢,则是需要自行码代码,在常规的可视化作图中,并不如tableau或其他BI软件操作简单方便。

今天,我们就来尝试用tableau public做一些常规的专利分析的可视化。


STEP 1 导入数据

首先从数据库中检索并下载数据,经过清洗和标引后将数据上传。

Tableau也可将多个上传的文件进行组合。

STEP 2 数据调整

Tableau会根据它自己的理解,自动将导入的Excel表中的各项数据进行分类,分为维度(Dimensions)和度量(measuers),同时还会根据单元格中的内容将字段标记为数字或日期信息(用“#”表示)、地理数据信息(用地球仪icon表示)、文本信息(用“Abc”表示)。

Tableau的默认分类可能并不是我们想要的,所以我们可以手动修改数据类型。

当数据类型为“度量(measuers)”时,才可以对其进行计数、计算平均值等操作,所以如果我们要统计申请量的话,就需要将“申请号”字段类型修改为“度量(measuers)”,这样Tableau才可以对其计数。

如果要绘制地图的话,就需要将“申请人国别代码”字段类型修改为“国家/地区”。

STEP 3 工作表的制作

点击界面右下角的“新建工作表”,就可以逐个创建新的空白工作表开始画图。

通过简单的拖拽,即可完成多种可视化图的绘制。下面举三个例子:

(1)申请趋势图

将“申请年份”(“申请年份”的字段,需要在ecxel表导入Tableau之前,在excel中对申请日进行数据提取得到)拖到列标签,将“申请号”(要先将其数据类型变成度量哦)拖到行标签。图表就自动生成了。还可以选择其他的图表类型。

(2)技术功效图(气泡图)

将“技术手段”拖到列标签,“技术效果”拖到行标签,“申请号”(类型为度量)拖到“大小”,就能立刻生成气泡图。

(3)申请来源国分布图

将“申请人国别代码”拖到列标签,将“申请号”(类型为度量)拖到行标签,然后再选择图表类型就OK了。下图展示的是采用热力地图或者treemap表现申请来源国分布。

此外,我们还可以根据需要对图表进行美化,例如修改配色,对象的大小,坐标轴距离,增加数据标签等。

STEP4 创建仪表板

通过将已建立的工作表拖动到仪表板中央,调整工作表的大小和布局,来形成一个数据联动的仪表板。

在这里小编仅仅以上面的三个图作为例子制作仪表板,虽然上面三个图之间可能没什么关联,不能充分体现仪表板的优势。小编只是抛砖引玉,希望大家能够做出关联性更强分析更深入的案例。仪表板的图表之间是相互连动交互的,利用这种交互的连动关系更易于挖掘和展示数据背后的故事。

 

今天只是初步的介绍了Tableau一些基础的使用方法,Tableau还有很多强大的功能值得挖掘学习,小编也在努力学习中,在之后的开源软件中将会继续介绍。


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多