分享

分析方法 | 开源专利分析方法

 yanyahoo 2017-01-05

2016-12-17 丑丑姐姐 专利分析可视化

专利分析可视化

一群热爱专利分析和热爱可视化的小伙伴共同维护的公众号,旨在传播专利分析可视化的思想和方法。

小编语


该专栏主要包括以下七个部分:

1. 了解专利数据(Introduction)

由于专栏的重点是让大家在实际操作中学习专利分析的方法,因而没有专门介绍关于专利的基础知识。为了方便初学者,作者很贴心地在YouTube上上传了一系列介绍专利基础知识的小短片供入门者学习。

另外,作者还提醒我们,开源专利分析需要用到很多工具和编程语言,我们需要在实际操作中不断学习。

2. 专利数据的获取(Obtaining Patent Data)

要了解一个领域的专利活动,最基础的事情就是要获得并理解该领域全部的专利数据。目前免费获取专利数据的数据库包括欧专局的espacenet数据库、Patent Scope、Google Patents、Patent Lens、Free Patents Online。另外,可以通过Google的批量下载功能批量下载整个美国专利商标局的专利数据。还有很多商业数据库,比如Thomson Innovation和PatBase也提供专利数据,而且Thomson Innovation还在DWPI数据库中对专利文献的技术信息做了进一步加工。

也就是说,现在已经有很多数据库可供我们选择。但是要在想要分析的特定领域获得又全又准的数据,还是让我们头疼不已。作者会为我们介绍这些不同的数据供应商,并且着重介绍那些实用而又免费的数据服务项目。

3.专利数据的清洗和标引(Cleaning and Tidying Patent Data)

做过专利分析的同学肯定都知道,专利分析中工作量最大的环节就是在分析之前对数据进行清洗和标引。特别是,不同数据库的数据具有不同的数据格式,所以对来自不同数据库的数据的清洗方式也各不相同。数据清洗环节最大的挑战就是得在数据分析之前把发明人和申请人的名称进行归一化处理,以及需要对文本字段进行整理。

该手册的作者为大家推荐了两本数据处理的参考资料,感兴趣的同学可以看一看。

1《The Elements of Data Analytic Style》Jeff Leek (https:///datastyle)

2. “Tidy Data”,HadleyWickham(PDF地址:http://vita./papers/tidy-data.pdf;视频地址:https:///33727555)

4. 专利数据分析(Analysing Patent Data)

专利数据分析是专利分析中最核心的环节,无外乎就是回答如下几个问题:谁?什么?哪里?何时?以及用什么?我们回答上述这些问题的方式取决于我们的分析需求。在几乎所有的情况下,我们都需要将这些问题的回答组合起来以便满足分析需求。

该专栏关注了很多分析工具,从比较简单的Excel到R软件等比较复杂的工具。作者使用R作为主要分析工具,因为R不仅具有强大的数据分析和可视化功能,还有很多免费的资源可供学习。后面将会介绍如何从零基础开始,在实操中学习如何使用R进行专利分析。

5. 专利数据可视化(Visualising Patent Data)

近年来,由于开源软件的日益普及,对复杂数据的可视化发生了很多的变化。这一变化的原因是,相比文字信息,人们更易于理解和吸收图形或图像传达的信息。以后会陆续介绍如何利用Tableau Public,Plotly和Shiny等工具制作网络图、地图和交互图表的方法。

6. 专利数据共享(Sharing Patent Data)

在这一部分将会介绍在考虑数据安全的情况下,如何将专利数据及分析成果与他人共享。

7. 工具和资源(Tools and Resources)

该专栏的目标之一就是建立一个有助于专利分析的工具和资源的访问列表,以供大家查找。以后还会不断往列表中加入新的资源。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多