同族处理器应用

紫风铃依然 2016-09-07

展开全文

如何应用同族处理器，快速导入数据，快速分析数据、快速获取分析结果的步骤与注意事项。介绍的解决方法对于国知局各分析项目有很大的针对性。

我们还会介绍如何利用同族处理器，通过导入、同族排序、分组3步，快速获得技术原创国家和技术目标国家的分析（秒杀）。

现在，我们开始同族处理器在分析中的应用直播介绍。

导入的文本文件，现在又提供DWPI输出的文件格式的支持。

这样，可以直接导入的是S系统的VEN格式，WPI格式，CNABS格式，DWPI格式。而且，不用在文本的开始插入标记，直接导入就可。

浅绿的是族的主专利，没有颜色的是该族的同族专利。必须指出，同族的族主专利可以根据用户的分析需求灵活变动。

我们今天要做个技术原创和技术目标国的分析，就会用到这些概念。

技术原创分析，许多人会认为用优先权国家就可以解决问题。

其实不然。许多同族并不是严格意义上的同族。像这些从系统导出的文件中，就会有好几个同族交叉混合。优先权国家可能会出现多个。

我们采用的方法是通过对每一个约定同族中的专利的申请日排序，找出申请日最先的专利为该同族的族主专利。从而这些最早申请的族主专利成为技术原创专利。

我们用3步来完成分析。

第一步，我们对导入专利按申请日排序，最早的为该族专利的主专利，并用浅绿标记颜色。

例如，KR1020030005607作为族主专利，申请日最早为20010709。

排在最后一篇是刚好1年后，20020709申请。

所以，原创专利就是那些有浅绿背景的专利。同族技术转移目标专利就是那些没有颜色的专利。

如果我们能把这些有背景颜色和没有背景颜色的专利分出来，那我们发现原创和目标专利的任务就完成一半了。

客户端有一个根据颜色进行分组的分组方法。

第二步，利用分组对已经按申请日排序的专利进行根据颜色的分组。

这样，我们得到根据颜色分组的2组专利。第一组是白色（无色）的为同族技术目标专利，第二组浅绿色的本来就是通过排序按最早申请日排出的族主专利，为同族技术的原创专利。

为了使Excel分析报告有意义，我们先对2个颜色分组的节点名进行重命名。

如果不重新命名，excel输出结果会有问题，因为2个sheet都是以“颜色”命名而导出失败。所以，我们重命名后再重新来一遍按国家分组。

excel-171.xlsx

当然这里的数据是随便拿过来的，不能算数。从分组结果中，我们可以马上发现中国是技术原创国的第二，而日本是技术目标国的第二。

如果数据是正确的，这些分组结果，可以提供许多以前不可能获得的信息。

下面我们简单介绍一下正确使用同族处理器的几点注意。

同族处理器有2种工作状态，1是展开，包括所有专利，而且可以通过排序来获得不同的族主专利，从而为进一步的分组分析打下基础。

其实，通过选择不同的排序规则（现在有4种），就是来选择哪些专利标颜色，哪些专利不标颜色。然而把这些标与不标颜色的专利分离出来，进行相应的分析。

另一状态是归并状态，归并后的专利，只保留族主专利。

这对人工、机器标引非常有用。这样，人工浏览只需看每一族的主专利，删除、移动、标引都只需对一篇主专利进行。这对机器标引也一样。

在归并模式下，删除一篇主专利，就删除该同族其它专利。

归并模式是临时工作状态。等完成操作后，马上对归并的族主专利进行展开操作。

特别是在保存分类器的cls文件时，一定要把节点下的专利，回复到展开状态。不然，保存文件会出错。

例如，为了做技术分组，我们先进行“归并”。

现在对这些归并后的族主专利按技术分组。

中英文自动各分出8组，外加'其它（Misc）'，保留为没有分组专利。

这样，我们可以对这些分组的主专利进行编辑、删除。在归并模式下删除主专利，会把该同族全部专利删除。

比如说，我们认为“动态图|...”下面的173个族主专利（以及族）都不是想要的，我们可以直接删除。

删除后的族主专利的技术分布。

除了已经分出的技术分组(节点下)以外，我们还需要对这些留下来的专利进行其它分组处理。这就需要把这些已经分在各个节点下的专利‘或’在一起。

用分类器的导入、导出功能，就能完成这一任务。

这是把分层结构的数据直接导出到无分层结构的缓存列表数据。

然后，再把缓存的数据导入客户端就可。

这样我们获得了处理后的族主专利，并通过同族处理器对该节点下的数据进行“展开”操作。

展开后是删除173个族以后的12682篇专利，用浅绿表示该族的主专利，白色为该族其它专利。

假定这12682篇处理过的数据需要保存，我们必须只对该节点下的展开的数据进行保存，而不能对整个分类器的所有内容进行保存。因为其它节点数据都在归并状态的，不能保存。

选择一个节点下的数据保存，我们用“导出”功能，而不是工具条上的“保存”按钮。

这样就可以在该阶段文件上继续进行分析。

还有，每次处理时，最好是同时按“CTRL”和“N'键，把分类器中无关内容清除。

这个就是上次处理后保存的数据。

注意，尽量避免在分类器中同时对1套数据的2个不同同族状态（归并和展开）的数据进行处理！

下面再介绍同族处理器的几个新加的命令。包括”数量“，”被引用次数“。

在对同族处理中，我们会对族内专利按规则进行排序，如申请日，文本的浏览优先级，和被引用次数。这样的排序是在每一个同族内进行。

例如在族CN101294872和CN100543441C专利中，872被引用2次，441C被引1次。因此，872被排为族的主专利。

另一个排序规则是在族与族间进行排序的规则。利用每一族包含的专利”数量“来对所有族主专利进行排序。族专利数最多的排在最前面。

命令”数量“是对归并后的专利处理。根据每一族中专利数量多少进行排序。

这是按每个族中包含专利数排序的结果，我们需要把它”展开“。

这个族包含专利最多，被排在第一位。像这些同族专利数多的专利，可能值得进一步分析，...

从这里，我们可以发现原系统提供的同族数据质量不是最理想。当然，这是统计分析，不是火箭科学，一个也不能差。

下面我们介绍在patentics上直接检索结果的同族处理器的应用。

这是美国2012年公开授权、申请前100个。我们进一步希望发现这些专利的全球同族。

p:isd/2012and top/100 and fmdb/all

结果: 610篇

导入客户端分类器，

从远程检索（主、从）导入的数据的默认模式是不对同族进行特殊处理。因此需要通过对导入数据按某一设定排序规则，对数据进行同族排序。

选一种排序方法，进行排序（选CN/US）。

到了这一步，所有前面介绍的同族处理命令都可使用。

从整体上看，patentics的同族要整齐多了。

今天介绍，需要大家更新客户端软件， training.patentics.com/web/VIP/SetupCn.msi

付费、免费体验用户，都用同一个客户端软件。

本周和下面几周介绍会比较频繁。因为我们有一批全新的检索分析命令，智能专利地图，关键词智能扩充器要在这里引入。

还忘了一点，客户端导出到Excel以前是个瓶颈。现在我们新做了一个Excel的Render，10000条输出，19秒。

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：紫风铃依然 > 《待分类》

举报/认领

0条评论

发表

请遵守用户评论公约

类似文章 更多

紫风铃依然

关注对话

TA的最新馆藏

今天你摩拜了吗？
印度专利申请程序介绍
面对儿童绘画，父母该如何跟随
2分钟学会扎这6款发型，让你美到尖叫！
数据处理 | 文献标引神技——单元格中突出显示特定字符
[数据处理] 有了这篇教程，SIPO小伙伴再也不怕倒腾数据啦

喜欢该文的人也喜欢更多

热门阅读换一换