分享

同族处理器应用

 紫风铃依然 2016-09-07

如何应用同族处理器,快速导入数据,快速分析数据、快速获取分析结果的步骤与注意事项。介绍的解决方法对于国知局各分析项目有很大的针对性。

我们还会介绍如何利用同族处理器,通过导入、同族排序、分组3步,快速获得技术原创国家和技术目标国家的分析(秒杀)。

现在,我们开始同族处理器在分析中的应用直播介绍。

导入的文本文件,现在又提供DWPI输出的文件格式的支持。

这样,可以直接导入的是S系统的VEN格式,WPI格式,CNABS格式,DWPI格式。而且,不用在文本的开始插入标记,直接导入就可。

浅绿的是族的主专利,没有颜色的是该族的同族专利。必须指出,同族的族主专利可以根据用户的分析需求灵活变动。

我们今天要做个技术原创和技术目标国的分析,就会用到这些概念。

技术原创分析,许多人会认为用优先权国家就可以解决问题。

其实不然。许多同族并不是严格意义上的同族。像这些从系统导出的文件中,就会有好几个同族交叉混合。优先权国家可能会出现多个。

我们采用的方法是通过对每一个约定同族中的专利的申请日排序,找出申请日最先的专利为该同族的族主专利。从而这些最早申请的族主专利成为技术原创专利。

我们用3步来完成分析。

第一步,我们对导入专利按申请日排序,最早的为该族专利的主专利,并用浅绿标记颜色。


例如,KR1020030005607作为族主专利,申请日最早为20010709。

排在最后一篇是刚好1年后,20020709申请。

所以,原创专利就是那些有浅绿背景的专利。同族技术转移目标专利就是那些没有颜色的专利。

如果我们能把这些有背景颜色和没有背景颜色的专利分出来,那我们发现原创和目标专利的任务就完成一半了。

客户端有一个根据颜色进行分组的分组方法。

第二步,利用分组对已经按申请日排序的专利进行根据颜色的分组。


这样,我们得到根据颜色分组的2组专利。第一组是白色(无色)的为同族技术目标专利,第二组浅绿色的本来就是通过排序按最早申请日排出的族主专利,为同族技术的原创专利。

为了使Excel分析报告有意义,我们先对2个颜色分组的节点名进行重命名。

如果不重新命名,excel输出结果会有问题,因为2个sheet都是以“颜色”命名而导出失败。所以,我们重命名后再重新来一遍按国家分组。

          excel-171.xlsx

当然这里的数据是随便拿过来的,不能算数。从分组结果中,我们可以马上发现中国是技术原创国的第二,而日本是技术目标国的第二。

如果数据是正确的,这些分组结果,可以提供许多以前不可能获得的信息。

下面我们简单介绍一下正确使用同族处理器的几点注意。

同族处理器有2种工作状态,1是展开,包括所有专利,而且可以通过排序来获得不同的族主专利,从而为进一步的分组分析打下基础。

其实,通过选择不同的排序规则(现在有4种),就是来选择哪些专利标颜色,哪些专利不标颜色。然而 把这些标与不标颜色的专利分离出来,进行相应的分析。

另一状态是归并状态,归并后的专利,只保留族主专利。

这对人工、机器标引非常有用。这样,人工浏览只需看每一族的主专利,删除、移动、标引都只需对一篇主专利进行。这对机器标引也一样。

在归并模式下,删除一篇主专利,就删除该同族其它专利。

归并模式是临时工作状态。等完成操作后,马上对归并的族主专利进行展开操作。

特别是在保存分类器的cls文件时,一定要把节点下的专利,回复到展开状态。不然,保存文件会出错。

例如,为了做技术分组,我们先进行“归并”。

现在对这些归并后的族主专利按技术分组。

中英文自动各分出8组,外加'其它(Misc)',保留为没有分组专利。

这样,我们可以对这些分组的主专利进行编辑、删除。在归并模式下删除主专利,会把该同族全部专利删除。

比如说,我们认为“动态图|...”下面的173个族主专利(以及族)都不是想要的,我们可以直接删除。

删除后的族主专利的技术分布。

除了已经分出的技术分组(节点下)以外,我们还需要对这些留下来的专利进行其它分组处理。这就需要把这些已经分在各个节点下的专利‘或’在一起。

用分类器的导入、导出功能,就能完成这一任务。

这是把分层结构的数据直接导出到无分层结构的缓存列表数据。

然后,再把缓存的数据导入客户端就可。


这样我们获得了处理后的族主专利,并通过同族处理器对该节点下的数据进行“展开”操作。

展开后是删除173个族以后的12682篇专利,用浅绿表示该族的主专利,白色为该族其它专利。

假定这12682篇处理过的数据需要保存,我们必须只对该节点下的展开的数据进行保存,而不能对整个分类器的所有内容进行保存。因为其它节点数据都在归并状态的,不能保存。

选择一个节点下的数据保存,我们用“导出”功能,而不是工具条上的“保存”按钮。


这样就可以在该阶段文件上继续进行分析。

还有,每次处理时,最好是同时按“CTRL”和“N'键,把分类器中无关内容清除。


这个就是上次处理后保存的数据。

注意,尽量避免在分类器中同时对1套数据的2个不同同族状态(归并和展开)的数据进行处理!

下面再介绍同族处理器的几个新加的命令。包括”数量“,”被引用次数“。

在对同族处理中,我们会对族内专利按规则进行排序,如申请日,文本的浏览优先级,和被引用次数。这样的排序是在每一个同族内进行。


例如在族CN101294872和CN100543441C专利中,872被引用2次,441C被引1次。因此,872被排为族的主专利。

另一个排序规则是在族与族间进行排序的规则。利用每一族包含的专利”数量“来对所有族主专利进行排序。族专利数最多的排在最前面。

命令”数量“是对归并后的专利处理。根据每一族中专利数量多少进行排序。


这是按每个族中包含专利数排序的结果,我们需要把它”展开“。


这个族包含专利最多,被排在第一位。像这些同族专利数多的专利,可能值得进一步分析,...

从这里,我们可以发现原系统提供的同族数据质量不是最理想。当然,这是统计分析,不是火箭科学,一个也不能差。

下面我们介绍在patentics上直接检索结果的同族处理器的应用。

这是美国2012年公开授权、申请前100个。我们进一步希望发现这些专利的全球同族。

          p:isd/2012and top/100 and fmdb/all

结果: 610篇

导入客户端分类器,

从远程检索(主、从)导入的数据的默认模式是不对同族进行特殊处理。因此需要通过对导入数据按某一设定排序规则,对数据进行同族排序。

选一种排序方法,进行排序(选CN/US)。

到了这一步,所有前面介绍的同族处理命令都可使用。

从整体上看,patentics的同族要整齐多了。

今天介绍,需要大家更新客户端软件, training.patentics.com/web/VIP/SetupCn.msi

付费、免费体验用户,都用同一个客户端软件。

本周和下面几周介绍会比较频繁。因为我们有一批全新的检索分析命令,智能专利地图,关键词智能扩充器要在这里引入。

还忘了一点,客户端导出到Excel以前是个瓶颈。现在我们新做了一个Excel的Render,10000条输出,19秒。


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多